%本文档请使用XeLaTeX编译
\documentclass[oneside]{ctexbook}
%\renewcommand{\normalsize}{\fontsize{11.5pt}{\baselineskip}\selectfont}%自定义字体为11.5pt，同时调整行间距
%\CTEXsetup[format+={\S}]{section}
%\usepackage{txfonts}和amsmath冲突，老旧宏包，不推荐使用
\usepackage{stmaryrd}
\usepackage{upgreek}%使用\upomega选项
\usepackage[a4paper]{geometry}
\usepackage{graphicx}
\usepackage{amsmath}%定义arccot,arcsec,arcsec
\DeclareMathOperator{\arcsec}{arcsec}
\DeclareMathOperator{\arccot}{arccot}
\DeclareMathOperator{\arccsc}{arccsc}
\usepackage{amssymb}
\usepackage{wasysym}
\usepackage{textcomp}%无符号平方根符号
\usepackage{fontspec}
\usepackage{hyperref}
\usepackage{titlesec}
%\usepackage[labelsep=period]{caption}%图片编号加点号
\usepackage[labelsep=quad]{caption}%去掉图片编号比号
\usepackage{tikz}
\usepackage{url}
\def\pgfsysdriver{pgfsys-dvipdfm.def}
\newcommand\parallelogram{
	\mathord{\text{
			\tikz[baseline] \draw (0,.1ex) -- (.8em,.1ex) -- (1em,1.6ex) -- (.2em,1.6ex) -- cycle;}}}
\usetikzlibrary{shapes.geometric}
\newcommand{\pxqdy}{\;
	\begin{tikzpicture}[line width=0.1ex,line cap=round]
	\draw (0,0) -- (1.4ex,0) [yshift=0.3ex] (0,0) -- (1.4ex,0);
	\draw (0.4ex,0.5ex) -- ++(70:1.2ex) [xshift=0.35ex] (0.4ex,0.5ex) -- ++(70:1.2ex);
	\end{tikzpicture}\;}%定义平行且等于符号
\bibliographystyle{plain}%可以尝试其他格式
\begin{document}
	\tableofcontents%目录
	%\listoftables%表格列表
	%\listoffigures#图片列表
	\chapter{符号与数学符号}
	人类是“从事构造化活动的动物”。人类总想给客观事物赋予某种意义或价值；利用符号认识新事物，使客观世界秩序化，创造出色的科学文化世界。
	
	所有的人类活动都基于象征表示，而类似于数学这种抽象本质的活动就绝对需要符号体系。
	
	\section{符号}
	符号，处处可见。例如学生的校徽，商店的招牌，公路边上的警示与提示标识牌，通讯中的旗语，密码，数学和物理中数字与符号，化学元素符号等，扑克牌“红桃”、“梅花”等，计算机显示器、雷达屏幕显示的信号…正如著名语言学家皮埃尔·吉罗所说的，“我们生活在符号中”。
	
	\subsection{什么是符号}
	一般来说，“符号”就是某种事物的代号，它的意义是，采用一一对应的方式，把一个复杂事物用简单形式表现出来。当某事物作为另一个事物的替代而代表另一个事物时，它的功能称为“符号功能”，承担这种功能的事物被称为“符号”。有时，当事者根据自己的主动性判断用某一个事物代替某事物，这时，前者也称为“符号”。例如，人们看到“闪电”就会预感到“打雷”，闪电就是“符号”。以此类推，人类可以把所有事物都冠以“符号”。
	
	“所有事物即符号”说法未免太过宽泛，现代符号学中所说“符号”是指为了传播一定信息而使用的，自然标志不用于传播目则不称为“符号”。尽管人们经常说云是雨的标志，烟是火的标志，但是符号学不承认它们的符号地位，因为这些“云”和“烟”并无意传播给我们信息。它和在地面上留下行迹的作案犯一样。
	
	不过，自然标志可以作为符号使用。例如，电视播放的气象云图中的云，公安部门对于指纹的语言描述等。
	
	为了区别于自然标志，人们把符号定义为传播意识的一种意愿标志。一种符号就是一种刺激，也就是一种可感实体，这种刺激为了传播而和另一种刺激的影像连在一起。因此，语言及语言的各种辅助手段，礼仪，交通讯号等等，都可作为符号。
	
	有些数学家，还对“符号”和“记号”加以区别。所谓记号是指外部可感知世界，它们彼此可以加以区分，并且可根据一定规则而有别于其他事物。例如，用耳朵听到的声音，用眼睛看到的图形和文字等。
	
	各记号之间有一种关系叫做同型关系或等价关系，这种同型关系满足三个性质：
	
	自反性：每个记号与自己同型。
	
	对称性：若事物甲与事物乙同型，则事物乙与事物甲同型。
	
	可传递性：若事物甲与事物乙同型，事物乙与事物丙同型，则事物甲与事物丙同型。
	
	把同型的记号共同性质抽象出来可以得到符号概念。
	
	例如：伸出四个手指，绳子上打四个节，地上划四条横线，碗里放四颗豌豆等，都可以作为记号，可以看作是同型的，对这类记号进行抽象可以得出出符号“4”概念。
	
	按照以上观点，记号是具体事物，符号是经过抽象而得到的抽象事物。很多书刊对符号和记号两种概念不做区分，在某些情况下，二者很难区分。
	
	人类为什么要创造符号呢？事情很简单，当我们讨论或提到某一事物时，在一般情况下，无法使用事物本身，必须使用表示该事物的符号。例如我们在讨论火山、地震或洪水时，我们不能把“火山”、“地震”和“洪水”搬到会议桌上；当我们说“宇宙不存在外星人”，我们目前就不大可能找到外星人。所以人类需要创造和使用符号。
	
	语言是人类生活中不可缺少的符号。是谁都知道且不可缺少的符号。是人类接触到的各种各样符号体系中最典型的符号体系。人们常说“语言是传达思想的手段”，或者考虑到语言感情功能而说“语言是表现与传达思想和感情的手段”，其实，语言不仅是“手段”，它还超越了“手段”的意义。“语言”同文化和思考问题的方法都有深刻的联系，因此，有语言学家提出，语言是“文化的象征，从而它能够规定思考方式”。语言是“文化的模式”，除掉作为手段和实用功能外，还具有美学功能。
	
	\subsection{符号与人类的关系}
	符号源于人类“给予意义”的行为，即给予某种事物以某种意义，从某种事物领悟出某种意义。凡是人类所承认的“有意义”的事物均是符号。
	
	人类“给予意义”的行为，在日常生活中，首先是依靠“语言”的使用来进行的，通过“创造语言”给予某种事物以某种意义。类似活动是所有人都在不停地进行中的。例如某人给自己养的一只大黄狗取名“安倍”，为什么要取名字呢？当然是为了区别于其他人的狗，需要说明的是这只狗很好战，需要加以防范。由于赋予名称，使黄狗具有其他狗不具有的价值，从而完成给予意义的活动。诗人、文学家、政治家等“为了打破日常语言约定俗成的规定”都不断地“创造语言”，并把这些新鲜词汇创造出来的意思，当做超越日常生活的工具。只要新词汇具有某种意义，则该词汇就是“符号”。例如，“体坛新星”、“东方巨龙”、“芦荡火种”等等。新“符号”所产生的新内容给我们的世界增加了新知识。这的确是一种创造性活动，是“创造语言”的活动。
	
	人类对于某些对象命名时，无需清楚了解事物本来面目或性质。比如：“上帝”一词早已有之，“上帝”本来面目是什么，也许终究弄不清楚。尽管如此，人们总想通过命名，假定某种事物的存在，并根据与自己的关系，给它规定一个位置。“上帝”这个符号是人类尝试描述某个未知事物，根据它和自己的关系，给予它某种意义，把它引入到我们世界中的产物。在自然科学研究中也经常引入某些未知粒子或天体符号，进行理性研究和论证。例如，最近几年，人类把天空中某些“飞行物”命名为“不明飞行物”，关于“不明飞行物”的研究越来越受到人们的关注。从宗教到艺术和尖端科学研究领域，人类总是要给周围事物命名，赋予意义，给予符号，以便捕捉未知事物，研究和掌握客观世界。
	
	现代，符号概念已不再局限于人类语言活动的一些标志，它已经扩展到人类社会的很多方面。人文科学中神话、宗教和文学等等，都被视为符号系统。几乎所有自然科学分支，都有其各自专有符号系统。不过，关于语言符号的研究，至今还是最重要的。因为它“简直就是其他符号研究的基础和模式”。
	
	人类使用以语言为中心的各式各样的符号，“肯定和维持已经诞生的人类文化秩序使其功能化”；“有效地处理新事物，把握其意义和价值，并把它纳入秩序化的社会中”。以致创造新的科学世界。正如某些学者所说，人类是“使用符号的动物”。
	
	\subsection{符号形式和符号内容}
	任何符号都包括两个方面，即符号形式（能指）和符号内容（所指）。符号是传播意识的一种意愿标志，其核心就是用“某事物代表某事物”。任何符号总要依赖于两个“某事物”间相互依存的关系。人们就把这两项依次称作“符号形式（能指）”和“符号内容（所指）”。瑞士著名语言学家、现代语言奠基人索绪尔称前者为“声音形象”，而后者是“声音形象所表达的概念”，还有学者称这两项为“表达表面”和“内容平面”。例如1949年南京“总统府”门楼上升起五星红旗，五星红旗是“符号形式”或“能指”，“南京解放”就是“符号内容”或“所指”。
	
	符号功能是用符号形式代表符号内容，基础是“符号形式”和“符号内容”间相互依存关系。缺少两项中任何一项，“符号”以至“符号功能”都不能成立。例如，鹦鹉模仿人类语言说“早上好”时，从表面看来使用了与人类一致的符号，但是它使用这种符号并非出于同样的符号内容，所以不能说鹦鹉与人类使用相同的“符号”或“符号形式”。其实，它们都是一些无所指的或者说没有符号内容的事物，不应作为“符号形式”来处理。
	
	另外，即使有内容，不给于表现形式，那它也谈不上是“符号”或“符号内容”。而且，就是由于有人类主动性解释，使“事物”“符号化”构造过程中，也只有某种意义（“符号内容”、“所指”）被解释后，这种事物才转化为“符号形式”。	
	
	“符号形式”与“符号内容”在逻辑上互为相互依存的关系是十分明确的。但是，二者相互依存关系在心理上并不一定总是对称的。在日常使用的语言中，“符号”一词运用常常是指“符号形式”。这是由于在符号的两个侧面中，“符号形式”对我们来说，是可以以某种形式感觉到的对象，而“符号内容”则未必。由于“符号形式”属于符号“显式”侧面，所以它能够很容易与“符号”本身的存在联系起来，暗示“不显眼的”符号内容的存在，从而代表“符号”整体。例如，“停止”这个符号形式，就属于这种情况。如果球赛正在进行，这“显眼的”“符号形式”就会暗示双方以“符号内容”--“停止球赛”。反之，用“符号内容”代表“符号”整体就很困难。
	
	“符号形式”优先，典型例子就是宗教性象征符号。这种象征性符号中的“符号内容”是在日常应用的符号的层次上难以理解的，它已经超越日常范围体验。信徒们相信在作为“符号形式”的象征符号背后，存在着某种“符号内容”，并有意识地体验和把握它。纳粹党旗中“卐”“符号”也是宗教符号。只要作为象征符号“符号形式”被明确地规定，“符号内容”的存在就会充分得到暗示。
	
	\subsection{符号学}
	符号学，顾名思义，就是研究有关符号的科学。
	
	有关符号的思想，可追溯至古代。古希腊哲学家亚里士多德在《解释篇》中讨论中论及语言时，已经涉及到符号问题。他写到“由嗓子发出的声音是心灵状态的象征，写出的词句是由嗓子发出的词句的象征。同样，写出的文字，在所有人哪里不会一样，尽管心灵状态在所有人哪里是一样的，这些心灵状态为其意向的事物也是一样的”。这里，他已经谈到了声音、心灵状态与事物之间的关系，象征与符号是同义词。
	
	稍后，斯多葛学派哲学家为了建立严密的三段论逻辑而明确讨论过符号问题。他们认为，符号有其发音的部分，有被其揭示的事物（它取决于人类思维），有被其指示的外部对象。它们是相互联系的，其中声音和对象是有形的，而事物是无形的。与现代人们所讲能指、所指和指代对象三个概念已经十分接近。
	
	到17世纪，德国哲学家、数学家莱布尼茨全面地发展了斯多葛学派哲学家关于符号的思想，他认为关于符号的科学，应能排列符号，使其表达所思。他终生事业之一就是寻找一种通用语言，潜心研究《万能算法》，目标是建立一种符号和术语体系，以便整理和简化逻辑推理的基本要素。他在数学中达到自己的目的。在一切科学和数学中，他所建立的无穷小运算是符号和术语体系的极好范例。莱布尼茨被誉为历史上伟大的符号学者之一。
	
	19世纪，布尔的符号逻辑发展了莱布尼茨的《万能算法》。布尔在其《逻辑的数学分析》中，把数学方法引入逻辑学，同时，提出不借助哲学和心理学就可以说明能指过程的一些数学程序。在这一道路上，美国哲学家、逻辑学家皮尔斯提出有必要建立一种新科学，这种科学论述符号意指作用（能指与所指关系），论述意指作用在诸系统之间的可调换性及它们在物质范畴内的关系，这就是符号学。在他看来，符号学不过是更广泛逻辑学代名词，他写道：
	
	“逻辑学，我认为我曾指出过，就其一般意义而论，只不过是符号学另一种说法而已，符号学是关于符号的几乎是必然的和形式的学说。在把这门学科描述成‘几乎是必然的’或形式的学科时，我注意到，我们是竭力来观察这些符号特征的，而且，根据这些观察，并借助于抽象活动的一种过程，我们已经到了可以对由科学才智使用的各类符号的特征进行十分必要的判断的时候了。”
	
	他的《存在的曲线图》一书，使人看出，他曾试图建立一种广泛的符号学。
	
	几乎在同一时期，索绪尔把符号学设想为“研究社会生活中符号生命的科学”。他把言语活动看成一个系统，而这个系统不同于纯粹逻辑系统，他写道：
	
	“语言是一种表达观念的符号系统，因此，可以比之于文学、聋哑人的字母、象征仪式、礼节、形弍、军用信号等等。 它只是这些系统中最重要的。因此，我们可以设想有一种研究杜会生活中符号生命的科学，它将构成普通心理学的一部分，我们称它为符号学。它会告诉我们符号是由什么构成的，受什么规律支配，因为这门学科还不存在，我们说不出它将会是什么样子，伹是，它有存在的权利，它的地位是预先确定了的。语言学不过是这门一般科学的一部分，将来符号学发现的规律也可应用于语言学，所以后者将属于全部人文现象中一个非常确走的领域”。
	
	这里索绪尔明确了语言学和符号学之间的关系，并预示了语言学研宄将会对普通符号学的发展倣出贡献。
	
	人们一般认为，皮尔斯与索绪尔是现代符号学奠基人。索绪尔着重符号社会功能，皮尔斯着重符号逻辑功能。这两方面是密切相关的。
	
	有关符号的一般理论是在本世纪初才出现的。这种理论最初以普通语义学的名称，首先引起了逻辑学家们的兴趣。索绪尔的设想，很晚才得到实施，那是1964年，法国著名符号学家罗兰·巴特写出了《符号学要索》一文。
	
	1969年，国际符号学研究协会成立，这标志着符号学研究进入了一个新阶段，之后，欧、美、前苏联及日本等国均有不少人开饴研究符号学；很多学科都采用了符号学的研究方法，符号学的分类研究，导致了符号学研究的各个分支的产生，使人们看到了符号学在不少领域具有广阔的前景。
	
	目前，数学符号学是亟待开垦的“处女地”。
	\section{数学符号}
	数学的世界是一个符号化的世界。
	
	使用符号是数学史上的一件大事。符号和公式等人工语言的制定是最伟大的科学成就，它在很大程度上决定数学进一步发展。数学语言“就像一座灯塔，照亮黑暗中很大一片区域，照亮自然的未被探索的秘密”。
	\subsection{数学语言}
	数学语言是由符号和记号组成的语言。
	
	数学概念本省很抽象，无影无踪的，为了传播数学概念，就必须借助于一些具体可感可代用物。这种不得不被无休止使用的代用物就是数学符号。
	
	“符号是交流和传播数学思想的媒介”。世界各国大部分都有各自独立使用的语言，汉语、英语、法语、德语、俄语…，但数学语言可以世界通用，它是“国际性的，是唯一完全国际化的语言。”凡是人类，并且受过一定数学教育的人，都认识下列符号语言，不需要再翻译：
	$$(a+b)(a-b)=a^2-b^2$$
	$$\cos 2\alpha=2\sin \alpha \cos \alpha$$
	$$\triangle  ABC\cong \triangle  A^{\prime}B^{\prime}C^{\prime}$$
	……
	
	形式主义学派曾提出一种看法：数学对象就是符号本身。数学的命题则是由一定的法则组成的符号系列，这些符号和符号系统可能有直观的涵义，但这些涵义并不属于数学。现代形式主义学派代表柯恩还提出，数学应当被看成一种纯粹的纸上符号游戏，对这种游戏唯一要求是不导致矛盾。
	
	尽管这些看法具有片面性，但也从一个侧面反映出数学语言具有符号化特征；他们的研究工作也曾产生过积极作用，推动数学发展。
	
	数学的对象不是符号本身。一百多年前恩格斯指出：“纯数学的对象是现实世界的空间形式和数学关系。”根据百余年的发展变化，现在徐利治先生进一步指出，数学是“实在世界的最一般的量与空间形式的科学，同时又作为实在世界中最具有特殊性、实践性及多样性的量与空间形式的科学。”由于“数学思想超越时代和地位，在社会、政治、经济条件之外进行，……作为社会和经济条件产物的自然语言不适合这种目的，因而不得不发明一种为进行抽象思维的符号语言。”尽管这种语言很抽象，但数学为生活的各种哲学提供新基础。
	
	数学语言是按照不同方向改革自然语言的结果：（1）简化自然语言，（2）客服自然语言中含糊不清的弊端，（3）扩充自然语言表达的范围。
	
	自然语言有不方便之处。例如表达把两数和的立方公式用自然语言表达，应该是：
	
	“两数和立方等于第一个数立方、第一个数平方与第二个数乘积3倍、第二个数立方与第一个数乘积3倍、第二个数立方四项和。”
	
	这样文字叙述很繁琐，如果改为数学语言：
	$$(a+b)^3=a^3+3a^2b+3ab^2+b^3.$$
	就可以大大缩短语言表达“长度”，且呈现出对象自身具有对称性。数学语言必须“从冗长的自然语言中解放出来”。
	
	自然语言具有模糊性。比如“机关”可以表示政府职能部门，可以表示阴谋诡计：“机关算尽太聪明，反误了卿卿性命。”还可以表示各种密室、仓库防盗设施等。“狄仁杰率领大军攻入大杨山，部下将领由于部下疏于防范，导致兵卒枉死于蛇灵总坛机关”。数学需要描述准确清晰。其中每一个符号，每一个符号组成的公式都具有一个特定意思。
	
	数学语言和自然语言本质区别其一在于使用变元。由于使用各种变元，数学语言能够明确表示一般规律，极大地扩充了语言表达范围。
	
	可见，把数学语言叫做符号语言是很有道理的。尽管自然语言也使用一定的符号，但它与数学是语言有本质区别的。“数学语言对任何人来说，不仅是最简单明了的语言，而且是最严格的语言”。当代，“数学不仅是事实和方法总和，而且是用来描述各门学科和实际活动领域的事实和方法的语言”。
	
	\subsection{名字}
	一个语言如果同时满足两个条件，就足以描述某类对象：（1）这类对象中每个对象都有各自对应语言表达---名字；（2）不同对象具有不同名字。
	
	如果不满足第一个条件，那么语言就过于贫乏，不足以描述这类对象，如果不满足第二个条件，那么语言就含糊不清。
	
	可见名字在语言中具有重要地位，它与讲话中表示对象联系在一起。一般地，人们把语法中称为专有名词（例如“上海”、“函数”、“太湖”）例叫做名词。对象是名字代表者或意义，既可以是具体对象，又可以是抽象对象（如方程$x^2-4=0$,$\triangle  ABC$，指数函数导数等），还可以是任意概念、性质、关系、过程、事件或事件系列等。
	
	同一个对象可以有不同名字，这些名字按不同方法描述给定对象。例如：
	
	记号$5-3$，$8\times2-14$,$(1+3):2$均可以作为数字"2"名字或符号。
	
	记号\{1,2,3,4\},\{1,3,2,4\}，\{1,2,3,4,3\}也都是集合\{1,2,3,4\}名字。
	
	等式$4-3=(3+2):5$表明，等式等号两边名字要表示同一个对象。
	
	但是，数学中用作名字的每一个符号，所表示对象不能多于一个。
	
	必须区分对象及其名字。在一个句子中遇到一些对象名字，这一句子讲述的是对象，而不是其名字。例如“将数字66分为两半”这句话。要是把记号66所表示对象---数字66分成两部分，计算结果为33。如果误解为“将记号66分为两半”，则结果为两个数字符号6。
	
	人们对某些对象命名时，不需要清楚了解它们本来面目和性质。在数学中情况也一样。一般来说，有可能理解名字含义，但对于其代表者却一无所知，只知道是由其涵义确定的。例如
	
	“方程$x^5-5x^3+1=0$最小实根。”名字涵义很明确，尽管我们不知道五次方程一般求跟公式。利用这个名字涵义，我们可以计算这个方程根到任意精度。
	
	由此可见，应该将“没有意义”和“没有涵义”这两个术语加以区分。例如，在自然数范围内，名字“方程$x+2=0$根”没有意义，或者说，符号条件解$x$不存在，但这个名字有确定涵义，它是一个数，代替方程中$x$使等号两侧相等，同理，实数范围内，名字“$\sqrt{(-2)}$”无意义，但它有涵义，表示平方等于$-2$。
	
	另外，一个名字是否有意义，与讨论对象范围有关。当范围扩大时，名字原来没有涵义，就可能获得意义。例如，名字$\sqrt{(-4)}$，将数域范围扩充到复数集时即可以得到确定值$2i$。	
	
	\subsection{变元}
	在数学中，始终表示同一对象的记号称作常元。因此，人们常把各种数学对象称为常元，因为每个名字始终表示同一个对象。例如名字“6”，“$\sin$”（表示正弦函数）。“$\mathit{N}$”（表示自然数集合），“$\sqrt3$”等等都是常元。
	
	{\heiti 例}\quad 求证任一自然数$n$与其后继数$(n+1)$乘积恒被2整除。
	
	考虑到自然数集具有无限性，故无法使用列举法对逐个自然数加以证明。我们可以选择"任意自然数$n$",并对自然数$n$分为两种情况作讨论。
	
	“当$n$是奇数时，$n+1$为偶数，则有$n(n+1)$为偶数；当$n$是偶数时，$n+1$是奇数，$n(n+1)$还是是偶数。”
	
	上述证明过程使用符号$n$，表示自然数集中任意一个元素。如果用自然数集具体元素名字代替，可证明具体元素符合结论。例如$n$=3,则$3\times(3+1)=12$是偶数。
	
	可见，上述推理过程中，符号$n$有具体名字代表者作用，就像自然语言代词有名词代表者作用一样。在数学中，这种与符号$n$类似的符号叫做变元。
	
	由此可见，变元是一种符号，可以代替表示某个集合任意元素。集合是由可以代替变元的元素组成，称作变元值集或变域。通常为非空的。
	
	数学表达式性质与变元的变域密切相关。例如分解因式$x^2-4$，则需要根据变元$x$所在变域，分别对有理数域、实数域和虚数域逐一讨论。使用变元时，需要注意变域。
	
	变元是一个数学基础概念，表面上看起来极其简单。以致于有数学家说“变元的概念并不是逻辑所必需的，可以不必引入。”事实上，变元是“数学语言的元素”。“不论在数学、数理逻辑乃至日常语言中都占有非常重要、非常关键的地位”。要澄清数学中某些模糊不清或容易混淆的概念，都离不开变元。苏联数学教育家斯托尼亚尔曾指出：“传统教学法根本缺点之一是，没有形成学生关于数学语言最重要因素---关于名字和变元的概念。”
	
	目前，很多人已接受类似观点：变元应该是指符号，不应该指事务或数量；严格来讲，变元是一种符号，它可以代替某类符号中任意一个符号。通常，人们说“变元可以代替任意一个变域中的事物”。数学家罗素也说“变元所指是含糊的，因而是不确定的事物”。这些说法都是不够确切的。所谓“任意”，所谓“不确定”，应该就符号而言，而不是就外界事物而言。因此，这种看法是不妥当的。
	
	关于变量一词，自17世纪引入数学以来，其意义一直不够清楚。一提到变，自然需要涉及到时间，而时间在数学中没有很好的定义过。从而，“自变量”提法本身具也有缺点，因为它必定依赖时间变化，不能脱离时间而“自变”。有学者建议废弃变量一词，而将变量改称“Argument（德文）”，但至今还没有恰当译名，但不应再译为自变量是肯定的。还有人主张将“自变量”和“因变量”分别译为“first entry”和“second entry”，但也没有很好的译名。因此，人们还要按照习惯使用“变量”，“自变量”，“因变量”等词。
	
	变元可以代替变域中任何符号，相反，它的位置可由变域中任何符号填入。因此，变元基本上就是空位。国外文献常把变元称为“位置保持者”（（Placeholder，英语），（ Platzhalter，德语）），它能够反映变元实质，非常富有有表现力。
	
	我国华罗庚金杯少年数学邀请赛，有一道题目是将0，1，2，3，4，5，6，7七个数字分别填入圆圈和方格内，每个数字只允许出现一次，组成只有一位数和两位数算式。填在方格内数字是多少？详见上图。
	\begin{figure}%\label{pi10}
		\caption{示意图}
		\centering
		\includegraphics[scale=0.5]{chatu3}\qquad
		\includegraphics[scale=0.5]{chatu4}
	\end{figure}
	
	美国小学数学教育现代化活动领导人戴维斯曾断言，从“小窗户”过渡到字母很自然且比较容易。
	
	这样做可以得到有关变元的正确观念。根本原因在于“变元基本上就是空位”。
	
	但是，变元和空位毕竟不相同。数学中不可能长期使用带有“小窗户”的语言。对于这种带“小窗户”的式子进行数学推演是困难的、极不方便的。从长远来说，必须引进变元概念及符号，否则数学是不能继续向前发展的。
	
	在某些符号组合中出现的古怪变元是不能用其值替代的。例如符号组和
	$$\sum_{n=1}^{n=6}\dfrac{1}{n+1}$$
	看起来像含有变元$n$，但如果用3代替$n$，就会得到无意义符号组合
	$$\sum_{3=1}^{3=6}\dfrac{1}{3+1}.$$
	
	事实上，$\sum\limits_{n=1}^{n=6}\dfrac{1}{n+1}$是一个完整符号，表示一个求和公式
	$$\dfrac{1}{1\times(1+1)}+\dfrac{1}{2\times(2+1)}+\dfrac{1}{3\times(3+1)}+\dfrac{1}{4\times(4+1)}+\dfrac{1}{5\times(5+1)}+\dfrac{1}{6\times(6+1)}$$
	，公式中不含变元。
	
	严格来讲，这种古怪变元根本不是变元，但通常则说，它以约束形式引入符号组合，称为约束变元。例如：
	
	记号“$\sum\limits_{n=1}^{n=6}$将变元$n$约束在符号“$\dfrac{1}{n(n+1)}$”（在$\dfrac{1}{n(n+1)}$中，n是自由变元，可以取任意自然数）。
	
	在公式$\lim\limits_{x \to 2}x^2=4$和$\int_{1}^{x}x^2dx=\dfrac{7}{3}$中，$x$作为约束变元被引入，在第一个公式中它约束与运算符“$\lim\limits_{x \to 2}$”，在第二个公式中约束于“$\int^{2}\cdots dx$”。
	
	公式$x^2=4$和$x<10$中，$x$是自由变元。
	
	如果某变元是约束变元，那么该变元可以替换成其他任意符号，而不改变表达式涵义。例如记号	
	\[	\sum_{n=1}^{n=6}\frac{1}{n(n+1)}\mbox{与}\sum_{ m=1}^{m=6}\frac{1}{m(m+1)}\]
	有相同涵义--它们表示同一个表达式。如果表达式中变元是自由变元，用其他符号代替时，表达式涵义发生改变。例如表达式"$3x+6$"和"$3y+6$"涵义不同。
	
	变元在数值中取值，这类变元称为数值变元。现代数学不仅要应用数值变元，还广泛应用点、向量、函数、集合以及命题变元。例如我们考察命题：
	
	“如果$x$，那么数3$a$被9整除。”
	
	如果$x$用命题用命题“数$a$被3整除”代替，可以得到一个真命题：“如果数$a$被3整除，则数$3a$被9整除”。这里，变元$x$值是一个命题，这里变元$x$是一个命题变元。
	
	应用各种类型变元，可以极大地扩展数学语言表达能力。
	
	当然，“变”与“不变”总是相对的。例如：在
	
	“函数$f:x\rightarrow \{x\}$在整数点间断，非整数点连续。”
	
	该命题中字母$f$用作常元，即作为确定函数名字。而在命题
	
	“闭区间连续函数$f$在该区间总能取最大值和最小值”
	
	中，字母$f$用作变元（它是一个全称量词，表示闭区间上任意一个连续函数）。
	
	在中学数学里，经常用形如“函数$f(x)=x^2$”式子表示函数$f:x\rightarrow x^2$意义。类似式子中，字母$f$也是用作表示常元。
	\subsection{数学语言表达分类}
	数学符号可以根据作用大致分为四类：
	
	1.数学符号。表示数或几何图形符号称为元素符号。例如：
	
	数字符号0，1，2，3，4，5，6，7，8，9。
	
	代数符号$a,b,c\cdots,m,n,\cdots,x,y,z,\cdots$。
	
	某些特定常数$e,\pi,i,\gamma$（欧拉常数）等。
	
	以上仅列举部分常用数学符号。
	
	三角形边$a,b,c,\cdots,x,y,z$。
	
	三角形角$A,B,C,\cdots,X,Y,Z$。
	
	另外还包括$\triangle,\angle,\parallelogram,\astrosun,\pxqdy$等。
	
	数字符号与$e,i,\pi$等为常元，其他字符往往用作变元。
	
	2.关系符号。表示数、式、形等之间关系的符号称为关系符号。例如：
	
	$=,>,<,\sim,\cong$。
	
	3.运算符号。表示按照某种规定进行运算的符号称为运算符号。例如：
	
	$+,-,\times,\div,\cdot,a^n,\sum,\sqrt{x}$等；
	
	$\sin,\cos,\tan,\cot,\arcsin,\arccos,\arctan,\arccot,\lim,\log,\lg,\ln$；
	
	$f,f^{\prime},y^{\prime},dx,\int$。
	
	行列式与矩阵符号。
	
	4.辅助符号。为方便表达和计算，数学中还引入一些符号用于某些特定表达式或某种特定意义，例如：
	
	$\Delta =\sqrt{a^2-4ac}\ \mbox{（一元二次方程判别式）}$,$n!\mbox{（阶乘符号）}$，Max，Min。
	
	括号$(\quad),\{\quad\}$等。
	
	三角形全等符号$(S,S,S),(S,A,S),(A,S,A)$。
	
	当然，以上所列举符号仅是部分常见基本符号。
	
	数学符号还可以按照数学学科领域划分，各个领域均要运用一系列专用符号。从中可以排出基本（原始）符号某一集合，这些类符号似外语字母表符号，人们称之为字母，它们组成字母表。例如代数字母表为：
	
	$\{0,1,2,\cdots,9,a,b,\cdots,x,y,z,+,-\cdots,=,<,>\}.$代数中使用其他符号都是由这个字母表中符号确定的。
	
	字母表中符号是原始“材料”，按照一定法则用来构造各种应用表达式---类似于自然语言中词和句。
	
	数学语言和自然语言都具有两方面内容：语义内容和语法内容。所谓语义内容是指符号表达式和它表示的对象间的关系，它指示符号表达式的内在涵义。例如表达式$a+b=b+a$语义内容是：对于“$+$”这个运算符来说，元素$a,b$先后顺序不影响运算结果。所谓语法内容是指符号表达的形式结构。
	
	数学语言全部表达式（广义来讲也包括传统“代数式”和“公式”）是字母表中符号序列，但是，不是所有符号序列都是数学语言表达式。作为数学语言表达式必须是按一定规则构造的有意义符号序列，比如“$2+1$”是表达式，而符号序列"2++"不是表达式。因为，符号“$+$”是表示两个元素进行运算的符号，所以，在语言表达式中，它只能在两个数或变元符号之间位置上。
	
	所有语言表达式集合可以分为简单和复杂两类。最简单是由单个字母或符号（或者数字有限序列，例如6616，$2a$）组成的；复杂表达式除含有字母或数字外，还可以包含其他符号。
	
	对于不含有变元表达式，可以划分为两类：
	
	（1）不包含关系符号的表示数表达式。
	
	例如，“$2+1$”与“3”，都表示数“3”。
	
	（2）包含关系符号“$=$”,“$<$”，或“$>$”任意命题表达式。
	
	例如，符号序列“$2+1$”是语言表达式，但意义和“$2+1$”或“3”完全不同，这是一个命题表达式。
	
	对于包含变元表达式也可以作类似分类。请观察下列表达式：
	
	（1）$7+x$；
	
	（2）$7+x=10,7+x>10,7+x<10$。
	
	从语法观点来看，表达式（2）和表达式（1）区别在于是否包含关系表达式（”$=$“，“$<$”，“$>$”）。显然，仅从语法上理解还不够，还必须弄清表达式意思，即采取语义处理。利用函数思想分析。比如，假设变元$x$取值范围是集合$A$=\{1,2,3,4,5\}，表达式（1）是数值函数，或者集合$A$=\{8,9,10,11,12\}上映射$A\rightarrow B$数值形式；（2）式中均是命题，表示数值变数逻辑函数（谓词），或者集合$A$到集合\{T,F\}（真或假）上映射$A\rightarrow\{T,F\}$，可由下表直观表示出来。
	
	\begin{center}
		\begin{tabular}{c|c|c|c|c}
			\hline $x$ & $7+x$ & $7+x=10$ & $7+x<10$ & $7+x>10$ \\
			\hline 1 & 8 & F & T & F \\
			2 & 9 & F & T & F \\
			3 & 10 & T & F & F \\
			4 & 11 & F & F & T \\
			5 & 12 & F & F & T \\
			\hline
		\end{tabular}
	\end{center}
	
	函数思想把语言形式的不同范畴结合起来。数值形式和命题形式都表示函数，第一个是数值函数，第二个是逻辑函数。	
	
	第一个表达式（$7+x$）,函数定义域和值域都是数集，第二个表达式，定义域是数集，值域是集合\{T,F\}。
	
	因此，我们可以把变元表达式分为两类：
	
	(a)不含关系符号且为数值形式，而且确定一个（或多个）数值变元的数值函数表达式。
	
	(b)含有关系符号，且为命题形式（给变元代入数值，即称为命题），而且确定一个（或多个）数值变元的逻辑函数表达式。
	
	以上分析可以引入如下数学语言表达式分类表：
	
	\includegraphics[scale=0.77]{P1}
	
	这里所用“表达式”这个术语，教学中称作“数学表达式”。这个分类可以提供一个基础，以便在教学中使用名词术语更有秩序，且能够更好地理解表达式语义。
	
	很多其他数学领域语言表达分类，均可参考上述分类方法。
	
	存在一些特殊表达式，虽然含有变元，但也表示命题而不是命题形式。例如公式：
	\[
	\lim_{x \to 2}x^2=4\mbox{与}\int_1^2x^2 dx=\frac{7}{3}
	\]
	均含有变元$x$，但表示真命题。
	
	上面两个表达式中变元$x$作为约束变元出现，而非自由变元。
	\section{数学符号发展简史}\label{sec:sec1}
	整个符号数学体系约有400余年历史，实际上，大部分数学符号历史没有不够400年历史。数学符号发展大致可分为五个阶段。
	
	\subsection{建立自然数和分数体系，特别是引入位值制计数法和零}
	
	现在世界通行计数法为十进制，数字符号是印度·阿拉伯数码0，1，2，3，4，5，6，7，8，9，0。所谓位值制，指的是根据数码位值确定表示数值。例如32和23具有相同数码，但32中2位于个位，表示2，23中2位于十位，表示20。十进制显然和人类十个手指头有关。恩格斯曾在《反杜林论》中说道：“数和形不是从其他地方，而是从现实世界中得来的。人们用来作第一次算术运算的十个指头，可以是任何其他东西，但是总不是悟性的自由创造物。”
	
	木头、骨头或石头作为计数符号从史前时代时就开始被使用。古代，数的概念虽早已发生，但表示数目符号发展很迟缓，经历过很漫长演变过程。“如果把世界上不同数码写法全部罗列出来可以写上厚厚一大本书。”现代国际上运用最为广泛数码是印度·阿拉伯数字（Arabic-Indic Digit）是印度人发明的，经历过漫长复杂的演变历史。最初印度人用梵文（印度古文字）表示数码，各地写法亦不完全相同。经过几百年演化，8世纪左右传入阿拉伯。字体因人而异，有较大差异，因此出现所谓东阿拉伯数字和西阿拉伯数字。12世纪左右，两种形式开始逐渐合流并传入欧洲。欧洲人称为阿拉伯数码。14世纪，中国印刷术传入欧洲。1480年英国部分印刷书籍中所使用数码已经相当接近现代写法。1522年，英国司斯托书籍中数码已经很和现代写法相当一致。
	
	位值计数法是人类智慧结晶，可以同发明字母相媲美。二者都是用少量简单记号代替复杂难记的符号。
	
	古埃及很早就使用十进制，但不知道位值制，较高进位单位都用符号表示。古希腊和一些古印度使用无位值十进制。
	
	中美洲玛雅人使用位值二十进制和十进制，但十进制不按位。巴比伦人使用60进制。
	
	中国使用位值十进制，公元前14世纪，中国开始使用算筹作为计数工具。具体什么时候开始使用，年代久远无法考证。战国时期晚期，中国运用算筹计数技术已经相当纯熟。
	
	算筹表示数目，分为横式和纵式。
	
\begin{figure}
	\centering
	\includegraphics{suanchou}
	\caption{算筹}
	\label{fig:suanchou}
\end{figure}

	
	计数时，筹算板一般是桌面或地面，通常没有格子。如果筹码2，3，1并排排列，有可能被误读为51或24；为了避免邻位误读，每隔一位交替使用竖码横码，即个位竖码，十位用横码，百位用竖码，千位用横码，如此类推，就可以完全避免误读。空位表示零。
	
	中国古代文字中，“零”字出现很早。不过那时不表示“空无所有”，而只表示“零碎”、“不多”。如“零头”、“零星”、“零丁”。中文〇数码出现较晚。部分史学家认为该数码于公元4世纪左右。
	
	“0”数码思维概念在世界其它地区也很早就有。古巴比伦人、埃及人、玛雅人以及印度人分别独立发明“零”。公元前3000年，巴比伦人就已经懂得使用零来避免混淆。古埃及早在公元前2千年就有人在记帐时用特别符号来记载零。
	
	很多民族不懂零，也不知道系统研究、处理和介绍零，在这一点印度人居功至伟。
	
	“0”这一数学符号的发明应归功于公元6世纪的印度人。他们最早用黑点“·”表示零，后来逐渐变成了“0”。0这个字体的数字是在5世纪由古印度人发明。
	
	发现0另一个版本历史：0的发现始于印度。公元前2000年，印度婆罗门教最古老的文献《吠陀》已应用“0”这个符号，当时0在印度婆罗门教表示空位置。约在6世纪初，印度开始使用命位记数法。7世纪初印度大数学家葛拉夫·玛格蒲达首先说明任何数加上0或减去0得任何数。遗憾的是，他并没有提到以命位记数法来进行计算的实例。也有的学者认为，0的概念之所以在印度产生并得以发展，是因为印度佛教中存在着“绝对无”这一哲学思想。公元733年，印度一位天文学家在访问现伊拉克首都巴格达期间，将印度的这种记数法介绍给了阿拉伯人，因这种方法简便易行，不久就取代了在此之前的阿拉伯数字。这套记数法后来又传入西欧。0这个字体的写法毫无疑问是印度人发明。
	
	在东方国家由于数学是以运算为主（西方当时以几何并在开头写了“印度人的9个数字，加上阿拉伯人发明的0符号便可以写出所有数字。由于一些原因，在初引入0这个符号到西方时，曾经引起西方人的困惑，因当时西方认为所有数都是正数，而且0这个数字会使很多算式、逻辑不能成立（如除以0），甚至认为是魔鬼数字，而被禁用。直至约15，16世纪0和负数才逐渐给西方人所认同，才使西方数学有快速发展。
	
	公元前前4世纪，中国数学家已经了解负数和零的概念。公元1世纪《九章算术》说：“正负术曰：同名相除，异名相益，正无入负之，负无入正之。其异名相除，同名相益，正无入正之，负无入负之。”
	
	斐波那契（Leonardo Pisano Bigollo，1775-1250），意大利数学家，他的著作《算盘之书》在欧洲最早出现分数线分数。为节约印刷版面，英国人棣么甘推推荐$a/b$表示$\dfrac{b}{a}$，类似记法出现于18世纪末。
	
	分数普及速度很慢，为节约篇幅，英国棣么甘推荐用$a/b$表示$\dfrac{a}{b}$，出现于18世纪末叶。
	\subsection{建立代数符号体系}
	代数学发展关键在于创建一套有效的符号体系。
	
	代数符号是在悠久岁月中经过不断改良、选择和淘汰的结果。内塞尔曼于1842年指出数学符号体系演变的三个阶段---文字代数、简写代数和符号代数。
	
	代数发展初期是文字代数。解题不使用简写记法，不用任何符号，而是用散文写成。公元前3600年左右古埃及纸草书用象形文字表示一次方程，公元前300年以前，代数都是文字代数。希腊时代，代数获得极大发展。代表人物是丢番图（公元246-330年），被誉为现代数学鼻祖。他的重要贡献之一是对希腊代数引进简写记法，使用简写文字表示三次多项式。还用字母表示未知元和部分运算，是近代符号代数开端。不过，世界上其他地方文字代数还在沿用，持续几百年。公元9世纪，阿拉伯数学家阿尔·花拉子模《代数学》书中，一切计算方法都是用文字语言表示。例如把方程$x^2+10x=39$写成“一个平方数及其根10倍和等于39”。尤其是西欧，15世纪以前，基本上都是文字代数，后来，才慢慢有个别人使用简写记法。
	
	15世纪，阿拉伯人已经开始在方程中使用阿拉伯数码，但形状和现代书写方式有很大区别，且书写方向是从右向左的。
	
	现代符号学开始于16世纪，出现在西欧。发展缓慢，直至17世纪才开始广泛流行。对符号体系变革产生最大变革的是法国数学家韦达（1540-1603年）。他是第一个有意识地、系统地在代数学中引入符号体系。他的名著《分析方法入门》一书对符号代数的发展有不少贡献，别认为是最早的符号代数著作。其中，他用辅音字母表示已知元，用元音字母表示未知元。
	
	对多项式系数加以修饰，用字母表示一般系数。还用过“+”和“-”符号。在韦达之前，人们一般用不同字母表示一个量的各种幂，韦达用同一字母，并适当加以说明。明确指出代数和算术区别，他说算术是与数打打交道的，而代数是研究表达式和解方程的。但他缺乏等号与乘号。但他的符号体系还很混乱。言辞与缩写混在一起，例如，其中写道
	
	$$A\quad cubus + B\quad planum\quad in\quad A_3\quad aequatur$$
	$$D\quad Solido$$
	现代方法表示为
	
	$A^3+3BA=D\mbox{或}x^3+3Bx=D.$
	
	英国数学家雷科德1557年出版代数书籍中首次使用现代等号，过去有人写过类似符号，但是平行线太长。
	
	1637年，笛卡尔《几何学》问世，首次提出用26个字母末位向前字母$x,y,z$表示未知数，首位向后字母$a,b,c$表示已知数，书中代数方程书写方式和现代写法已基本一致，但缺少幂符号，他分别用$x^2,x^3$代替$x\cdot x,x\cdot x\cdot x$。现代代数符号体系主要采用笛卡尔的符号。
	\subsection{微积分产生联系的符号的发展}
	微积分不是凭空产生的，而是经历过很长时间酝酿，最后在17世纪中叶，经牛顿与莱布尼茨发展完成的。正如恩格斯所说，微积分是：“由牛顿和莱布尼茨大体上完成的，但不是由它们发明的”。微积分计算方法在牛顿、莱布尼茨之前已经散见于各国著作中，积分思想，早在希腊时期已经萌芽。牛顿和莱布尼茨最大功绩在于将两个貌似不相关问题相联系起来，一个是切线问题（微分学中心问题），一个是求积问题（积分学中心问题），建立两者之间的桥梁，即所谓的牛顿---莱布尼茨公式。牛顿和莱布尼茨分别引入一套导数、微分和积分等符号，但牛顿引入的符号，基本上已经全部淘汰。而莱布尼茨建立的符号一直沿用至今，基本上没有什么实质性变化。
	
	\subsection{集合论与数理逻辑符号在数学中发展和渗透}
	现代代数中，“集合论已构成全部数学基础”。其概念和方法几乎渗透到数学各个分支乃至很多自然科学部门。数理逻辑，又称为符号逻辑，是研究推理，特别是研究数学中的推理的科学。
	
	现代，集合论和数理逻辑的符号正逐渐向数学领域逐渐发展。例如：
	
	集合符号，$A$，$B$，$C$。
	
	$\in$---属于，$\cup$---并，$\cap$---交。
	
	$T$---真命题，$F$---假命题。
	
	$\varnothing$---空集，$\wedge$---合取，$\vee$---析取。 %
	
	$\Rightarrow$---推出；$\Leftrightarrow$等价。
	
	$\forall$全称量词；$\exists$---存在量词。
	
	这些符号大体上由19世纪中叶由意大利数学家皮亚诺引进的。
	
	这些符号促使数学语言更加简便，更便于推理。例如，关于函数一致连续定义：
	
	
	函数$f(x)$在区间$(a,b)$上连续一致，如果存在任意$\varepsilon>0$，总是存在$\delta>0$，对于区间$(a,b)$任意$x_1,x_2$，$\mid x_2-x_1\mid<\delta$，必有不等式$\mid f(x_2)-f(x_1) \mid<\varepsilon$成立。
	
	还可以写成：“函数$f$在区间$(a,b)$上连续，如果：”
	
	$\forall>0 \exists\delta>0 \forall x_1 \in (a,b) \forall x_2 \in (a,b) \mid x_2-x_1 \mid<\delta \Rightarrow \mid f(x_2)-f(x_1)\mid<\varepsilon$。
	
	该写法容易构造所给性质的否定，只要通过改变量词与否定不等式即可。
	
	“函数$f$在区间$[a,b]$上不一致连续，如果：
	
	$\exists \varepsilon >0,\forall \delta >0,\exists x_1\in [a,b] \exists x_2 \in [a,b] \mid  x_2-x_1\mid<\delta\wedge\mid f(x_2)-f(x_1)\mid\geqslant\varepsilon $.”
	
	\subsection{电子计算机促进数学符号新发展}
	计算机语言不同于一般数学语言，符号需要便于输入计算机，由于程序需要和限制，需要作出相应修改。例如计算机编程语言中无法直接和计算书写上标，需要加以改变。计算机中几乎全部编程语言中小数采用浮点数表示等。
	
	伴随着数学发展，数学符号也处于不断发展过程中。
	
	\chapter{数学符号动力作用}
	数学在发展，数学符号也随之创新、发展。另一方面，数学符号创新又推动数学的发展。
	
	数学发展动力究竟在那里？毫无疑问，来自于社会生产和技术发展客观需要，除去外部动力外，还存在内在动力因素，正如希尔伯特所说：
	
	“在每个数学分支中那些最初、最老的问题肯定起源于经验，是由外部现象世界所提出……，但是，随着一门科学分支的进一步发展，人类的智力，受到成功鼓舞，开始意识到自己的独立性。它自身独立发展，通常不受到外部明显影响，而只是借助逻辑组合，一般化、特殊化，巧妙地对概念进行分析和组合，提出新的富有成果的问题……。”
	
	使用数学符号是推动数学发展内在动力因素之一，“数学的一切进步都是对引入符号的反应。”在数学里，有人把17世纪叫做天才的时期。也有人把18世纪叫做发明的时期，为什么在这两个世纪数学有很大发展呢？原因之一，就是在于这两个世纪，大量创造和使用数学符号。
	
	历史表明，数学符号与数学方法有密切关系。数学上对一般方法论关心出现于16至17世纪，正式由于代数符号体系建立而引起的。目前，关于数学方法论的研究方兴未艾，研究数学符号对数学发展的动力作用是研究数学中的发现、发明与创新等法则的重要课题之一。
	
	诚然，数学符号发展动力作用可以简单概括为一句话：“没有数学符号，就没有现代数学”。不过说法未免笼统，作为数学方法论研究课题之一，我们必须结合数学发展过程做出一些具体分析。
	
	\section{符号对数学发展影响}
	数学符号演化自身规律表明，数学符号化必须适用数学体系发展的需要。“一种合适的符号比一种不良的更能反映真理”。符号的优劣直接影响数学发展的速变。在数学发展过程中，一方面对符号的改革与日俱增，另一方面，符号的改进又加速数学学科的发展。
	
	欧洲在阿拉伯数码输入之前，使用罗马数码。计数法用
	\[
	\mathrm{I,II,III,IV,V,VI,VII,VIII,IX,I,L,C,D,M}
	\]
	分别表示1,2,3,4,5,6,7,8,9,10,50,100,500,1000，它不是十进制，一个简单数字要写上很长一串，这种笨拙的计数法在12世纪以前盛行于欧洲，有些国家直到16世纪还在使用。那时，“你做加减法已相当困难，会乘除法就可以称为专家”。运算方法及其繁复，因此有人形容用罗马数字进行分数运算之艰难---“掉到分数里面去”。
	
	这种情形严重影响数学发展。正因为如此，用印度·阿拉伯数码代替罗马数码势在必行，阿拉伯数码明显有促进数学发展作用。
	
	阿拉伯传入我国，最早在13世纪，但迟迟没有被采用。直到18世纪末期，有些书本中，才正式采用阿拉伯数码，但不是采用横写而是竖式。19世纪初，才慢慢采用现代写法。
	
	数学史家分析，我国不采用阿拉伯数码，主要原因可能主要是我国长期使用算筹式数码计数法，十进制，和阿拉伯数码计数法效果相同，而汉字一、二、三、四、……笔画简单易写，一时还不能看不出阿拉伯数码具有显著优点。欧洲中世纪用的笨拙的罗马数码，和阿拉伯数码计数法相比就显得十分落后，因此更容易接纳新计数法。
	
	毫无疑问，迟迟不用阿拉伯数码，对我国数学发展具有一定影响。
	
	微积分的出现是人类历史上的一件大喜事。恩格斯高度重视微积分在自然科学中作用。他指出，“只有微积分才能使自然科学有可能用数学不仅表明状态，并且也表明过程：运动。”科学的微积分符号的作用对发展微积分成果、推动后世自然科学自然科学的发展极为重要。正如拉普拉斯所说：“数学分析语言，所有数学语言中最完善的语言，而且语言本身就成为新发展的有力工具。特别是那些被构思出来的种种必要概念，往往是许多新算法起点。”如果没有完整微积分符号，自然科学就不能发展到如今水平。
	
	众所周知，微积分“大体上是由牛顿和莱布尼茨完成的”，现在微积分符号基本上是沿用莱布尼茨所创设的。
	
	牛顿也创建了一套符号。
	
	1669年，牛顿完成第一篇微积分论文，题为《运用无穷多项方程的分析学》。其中，牛顿提出一种积分法，把变量无穷小增量叫做“瞬”，记做“o”。
	
	例如，假如存在一条曲线$y=f(x)$，其下面积为$Z=ax^n$（$m$是有理分数），当横坐标$x$获得一个无限小增量，即瞬$o$时，有新坐标$x+o$，产生增面积，即面积瞬$oy$。新面积为：
	$$Z+oy=o(x+o)^n.$$
	由二项式定理
	\[
	Z+oy=a(x^m+mx^{m-1}\cdot o+\frac{m(m-1)}{1\cdot2}x^{m-2}\cdot o^2+\cdots).
	\]
	考虑到$Z=ax^m$，并在等式两边除以$o$,得
	\[
	y=mx^{m-1}+a\cdot\frac{m(m-1)}{1\cdot2}x^{m-2}\cdot o^2+\cdots.
	\]
	略去含$o$项，得到
	\[
	y=max^{m-1}.
	\]
	这就是对应面积$Z$纵坐标$y$表达式。结果表明，若面积$Z=ax^m$给出，那么构成面积曲线为$y=amx^{m-1}$。反之，如果曲线$y=max^{m-1}$，那么下面的面积就是“$Z=ax^m$”。
	
	在这里，牛顿不仅给出求一个变量对另一个变量瞬时变化率的普遍方法，而且通过证明面积可以由求变化率逆过程得到，揭示了微积分基本性质。但其中有不少含混的地方。例如“$o$”是不是0？牛顿认为不是，既然这样，为什么在运算中可以略去含有0的幂的项呢？牛顿没有给出合乎逻辑说明。
	
	1671年，牛顿整理他6年以来关于微积分的研究工作，写成《级数法和流数法》，这是牛顿在数学方面代表作。此书在1736年才正式出版。其中，牛顿引进他的独特符号和概念：他把随时间变化的量，即以时间为独立变数的函数称为流量，用字母表后几个字母“$v,x,y,z$”表示；而把流量变化速度，称为流数。或简称“速度”，用加上小数点表示。如$\dot{y}$表示$y$流动率，以此类推。因为时间是所有流动量的自变量，$\dot{x},\dot{y},\cdots$,相当于莱布尼茨$\dfrac{dx}{dt},\dfrac{dy}{dt},\cdots$，他保留“瞬”的概念，并用"$o$"表示。
	
	稍晚些，牛顿在他另一本著作《曲线求积论》中重新解释他的符号，在下列符号
	$$x,\dot{x},\ddot{x}\cdots$$
	中每一个数是前一个的流动率（导数），最后一个的流动量（原函数）。
	
	其间，他还指出确定“$x$”流动率方法：
	
	当$x$“由流动”变成$x+o$，$x^n$“变成$(x+o)^n$”，展开成级数：
	\[
	(x+o)^n=x^n+nox^{n-1}+\frac{n^2-n}{2}o^{n-1}+\cdots.
	\]
	两边减去$x^n$，得到函数增量
	\[
	(x+o)^n-x^n=no^{n-1}+\frac{n^2-n}{2}0^{n-2}+\cdots.
	\]
	为避免略去“含有$o$”项，牛顿接着考虑自编增量“$o$”与函数增量比，它等于
	\[
	1:nx^{n-1}+n\frac{n-1}{2}ox^{n-1}+\cdots.
	\]
	当增量消失时，它们“最后比”就是
	\[
	1:nx^{n-1}\mbox{或}\frac{1}{nx^{n-1}}.
	\]
	这个“最后比”不是别的，它“是$x$流数与$x$”流数比，这种方法，除极限方法外，大致和现代教科书基本一致。
	
	综合上述可见，牛顿在创建微积分时也不得不考虑符号问题。但是，牛顿更关心创立微积分体系和基本方法，而莱布尼茨似乎更关心运算方式建立与推广，并力求建立微积分规范，即法则和公式系统。莱布尼茨对符号的关心超过牛顿，他是历史上最大符号学者之一。他所创立的微积分符号远优于牛顿符号，对微积分有很大影响，正像阿拉伯数码促进算术发展一样。
	
	有一段数学史对我们阐明这节主题是有益的。
	
	1684年，莱布尼茨发表微分法，1686年发表微积分。以发明时间来说，牛顿是先行者（早10年），但他的流数术到1687年才以几何形式发表，而《流速术》本身直到他死后9年（1736年）才印刷出来，莱布尼茨比牛顿较早公布（早三年）。为此，英国数学家和欧洲大陆数学家发生过一场持续几个世界的大论战。
	
	大陆派学者在接受莱布尼茨符号以后，经过伯努利家族、欧拉、达朗贝尔、拉格朗日、拉普拉斯等人进一步工作，很快取得丰硕成果，渗透到数学各个分支。
	
	英国情况如何呢？苏格兰克鲁格在1865年采用莱布尼茨符号和概念，三十余年后，由于英国人狭隘民族偏见再加上对牛顿盲目崇拜，放弃这种符号改用牛顿”流速术“，迟迟不肯接受大陆的成就。，因此，其数学发展就相应落后了。其实，这种争论，没有什么实际的价值，反而使英国数学发展受到很大影响。
	
	数学符号的优劣对数学发展的影响，从这个历史教训中，便可略见一斑。
	\section{速记符号引申出新分支}
	为了有利于传播数学思想，有利于运算和推理，在数学中必须构造很多速记符号。例如指数幂符号“$a^n$”，阶乘符号“$n!$”，行列式与矩阵符号等都是速记符号。诸如此类速记符号，不仅帮助人们理解现有理论，简化运算、推理步骤，还能帮助人们看清楚更为深刻的数学关系，建立更为重要的理论，乃至引申出新数学分支。正如希尔伯特所说：“数学中每一步真正的进展都与更有力的工具和简单的方法的发现密切联系着，这些工作和方法同时会助于理解现有理论，并把陈旧繁杂的东西抛到一边。数学科学发展的这种特点是根深蒂固的，因此，对于个别数学工作者来说，只要掌握这些有力的工具和简单方法，他们就有可能在数学各个分支中比其它科学家更容易找到前进道路。”
	
	美国数学家M·克莱因曾说：“行列式和矩阵完全是语言改革，对于已经以较扩展的形式存在的概念，它们是速记的表达式。”这里，有必要追本溯源，看看他们的形成简史。
	
	行列式这个概念起源于研究对线性方程组。我国古代数学家解线性方程组时，用算筹把未知数系数排成方阵，在对二元或三元线性方程组用消元法求解过程中，导致一个二阶方阵或三阶方阵与一个数对应，其中就蕴含有行列式思想。
	
	最早引入行列式概念的是17世纪日本数学家关孝和。他在1683年发表《解伏法之法》（意思是“解行列式问题的方法”）一书中，已经谈到行列式和它的展开问题。
	
	在欧洲，最早研究线性方程并论及行列式的是莱布尼茨。
	
	首先用行列式方法解线性方程组的是英国数学家马克劳林。他的记法不太好。稍晚些时候，瑞士数学家克莱姆在其著作《线性代数分析导论》一书中给出用行列式解线性方程组的法则，就是现在的“克莱姆法则”。他还提出行列式展开法则。1764年，法国数学家裴蜀把确定行列式每一项符号的手续系统化，并证明：系数行列式等于零是齐次线性方程组有非零解的条件。
	
	后来，荷兰数学家范德蒙把行列式理论与线性方程组求解问题相分离，并对行列式理论作作出过系统逻辑阐述。
	
	现在行列式理论已经广泛应用到很多数学分支。
	
	矩阵和行列式一样，也是由研究线性方程组引行起的。
	
	我国《九章算术》中，有线性方程组
	\begin{equation*}
	\begin{cases}
	3x+2y+z&=39 \\
	2x+3y+z&=34 \\
	x+2y+3z&=26
	\end{cases}.
	\end{equation*}
	从逻辑上来说，矩阵概念先于行列式概念，而在历史上次序正好相反，矩阵概念是从行列式研究中引申出来的。行列式的研究开始于18世纪中叶。行列式包括一个数字方阵，通常总是涉及这个方阵的值，就是由行列式的定义所给出的值。然而人们从行列式的大量研究工作中发现，对于很多问题，方阵本身都可以研究和使用，不管行列式值是否与该问题有关。方阵本身就称为矩阵。矩阵这个词是英国数学家西勒威斯特首先使用的，他希望引用数字的矩形阵列而不能再用行列式这个词，从而提出矩阵这个词。不过，他仅仅涉及到方形矩阵。
	
	英国数学家凯利首先发表一系列文章论述矩阵基本概念、性质及运算等。因此，他被誉为矩阵论创造者。他说：“矩阵…或是直接从行列式概念而来，或是作为一个表达方程组：
	\begin{equation*}
	\begin{cases}
	x^{\prime}=ax+by \\
	y^{\prime}=cx+dy
	\end{cases}
	\end{equation*}
	的方便的方法而来的。”于是引入矩阵
	\begin{gather*}
	\begin{pmatrix}
	a&b \\
	c&d
	\end{pmatrix}
	\end{gather*}
	它代表这个方程组主要信息资料。
	
	数学家C·牛松说过：“和许多经典科学相比，现代社会科学家与自然科学家发现数学符号阐述具有重要意义，这种意义表现在它具有从社会和自然宇宙中得到的数据联系起来的能力，以及因而还具有对带有科学重要性的本质问题作出回答的能力。”
	
	行列式和矩阵明显具备上述能力。
	
	下面谈矩阵：
	
	解析几何中二次曲线方程
	$$ax^2+2bxy+cy^2+2dx+2ey+f=0$$
	与矩阵
	\begin{gather*}
	\begin{pmatrix}
	a&b&d\\
	b&c&e\\
	d&e&f
	\end{pmatrix}
	\end{gather*}
	密切相关，可以认为是上述二次曲线矩阵，该矩阵行列式
	\begin{gather*}
	\begin{vmatrix}
	a&b&d\\
	b&c&e\\
	d&e&f
	\end{vmatrix}
	\end{gather*}
	就是这个二次曲线一个不变量。
	
	矩阵把曲线方程各项系数关联起来，用以表示二次曲线，而且有明显效果。
	
	在工程技术、经济工作中，有些问题解决需要考察等方面因素，从整体上反映其数量关系，如电子网络系统，经济规划，商品产销关系等等都可以用矩阵关系把有关信息“联系起来”。比如有$S$个产煤地区：$A_1,A_2,\cdots,A_n$需要销售到$n$个地区：$B_1,B_2,\cdots,B_n$，则一个调运方案可用一个矩阵
	\begin{equation*}
	\begin{vmatrix}
	a_{11}&a_{12}&\cdots&a_{1n}\\
	a_{21}&a_{22}&\cdots&a_{2n}\\
	\vdots&\vdots&\ddots&\vdots\\
	a_{m1}&a_{m2}&\cdots&a_{mn}\\
	a_{m1}&a_{m2}&\cdots&a_{mn}\\
	\end{vmatrix}
	\end{equation*}
	来表示，其中$a_{ij}$表示产地$A_i$运到销售地$B_j$数量。
	
	在图论中，把各种具体事物线路图抽象为图，图又可以借助于矩阵把有关指标联系起来，从而得到图的矩阵表示。
	
	在对策论中，可以把竞争双方各项决策以及相应竞争效果用矩阵“联系起来”，便于谋求最优策略。
	
	如此等等，不胜枚举。
	
	这种能力，反映了数学符号生命力。正如美国数学史家D·斯特洛伊所讲，合适的数学符号“带着自己的生命，并且它又创造出新生命来”。数学发展史证实了这种观点。当代行列式理论已经广泛渗透到许多数学分支，成为这些分支不可缺少的工具。矩阵理论本身也在发展，本来，矩阵元素均为实数，到19世纪末20世纪初，已经开始专门研究元素属于抽象域的矩阵性质。另外，由于积分方程理论的推进 ，人们还研究过无限阶矩阵。
	
	“只要世界还存在数学家，革新就不会停止”。创设新速记符号还可以引出新数学分支。
	\section{符号化导致新学科诞生}
	我国古代数学成就辉煌，明代以前很多方面一直遥遥领先于西方各国。我国是最早使用十进制、位值制计数法和零的文明古国之一。最早使用分数和小数，最早系统地总结几何学基础知识，最早发现勾股定律，最早掌握线性方程组和高次方程根近似解法，最早研究不定方程、一次同余方程组，并给出“中国剩余定理”，等等。但是，自明朝中期以后，我国数学水平就开始大大落后西方各国。原因是多方面的，其中令人痛心的一方面就是因为我国古代数学忽视使用数学符号。
	
	近代数学家们都十分重视使用数学符号化，符号化使数学本身以及其他以数学为主要工具的科学面貌发生革命性的巨大变化。
	
	代数学是怎样成为独立学科？
	
	近代，代数学是以研究各种代数结构的性质为中心。然而，在19世纪以前，代数一直理解为关于方程的科学，它的发展是和方程分不开的。
	
	代数和算术主要区别在于前者引入未知量，根据问题条件列出方程，然后解方程求出未知量解。1873年，华蘅芳和英国人傅兰雅合译英国华里斯《代数术》。指出“代数法，无论何数，皆可以任何符号代替之…”，说明所谓代数，就是用符号来代表数字的一种方法。
	
	代数学发展首要条件就是引入符号代替数字；用符号代替文字叙述。在第一章\ref{sec:sec1}节，我们已经看到在这方面韦达功劳最大，他第一个比较有意识地、系统地使用符号代替算式和数字。并对字母符号进行运算，使“代数”开始正式成为一门独立学科。正如德国数学家克莱因所说：“代数学之进步是由于引入较好的符号体系，这对于它本身和分析的发展比16世纪技术上的进步远为重要。事实上，采取了这一步，才使代数有可能成为一门独立学科。”
	
	古希腊数学在几何方面取得辉煌成就，但在代数方面发展缓慢，很大程度上是由于缺少适当的符号体系。古埃及、古巴比伦、古印度和古代中国数学符号化都不够彻底，因而均未能发展出有近代形态的代数理论。
	
	符号化不仅产生独立代数学，还直接刺激解析几何的诞生。
	
	大家熟知解析几何是借助坐标系用代数方法研究几何问题的一门学科。
	
	17世纪，法国数学家笛卡尔《几何学》是解析几何发展的起点。笛卡尔是一位杰出的近代哲学家和近代生物学奠基人，又是出色的物理学家和数学家。他努力寻求发现真理的方法，把方法论作为一切工作的首要对象。他于1628年写成第一部著作《思想指导法则》，1637年，出版《更好地指导推理和寻求科学真理的方法论》，包括三个附录，《几何学》就在其中。
	
	当时，“几何学”并不专指现代几何，也和“数学”是同义词，正如我国古代“数学”和“算术”是同义词一样。
	
	其实，坐标法思想可以追溯到古希腊。阿波罗尼斯(前260年--前170年)研究圆锥曲线时,曾引用两条正交直线,作为一种坐标。取圆锥体底面直径作为横坐标，过定点垂线作为纵坐标。稍晚，天文学家依巴谷采用经纬度表示星球位置,实质是用两个坐标确定一点位置。14世纪，法国数学家奥力森陈述一种坐标几何，用坐标确定点位置，这是从天文、地理坐标到近代解析几何学的过渡。其著作对笛卡尔的工作有一定影响。刺激笛卡尔创立解析几何的直接因素还是韦达的符号代数。笛卡尔强烈的意识到代数的巨大威力。他把代数看作是推理，尤其是对未知量进行推理的有效方法。在笛卡尔看来，欧几里得过分强调证明技巧，过分依赖图形，对每个问题的证明都需要一个新的特殊方法才能解决。这不仅是“笨拙和不必要的”而且使得几何“失去科学形象”；而代数又太受法则和公式的束缚，影响人们思维的灵活性。然而，笛卡尔觉察到符号代数具有一种能使思维“机械化”的可能，这种思维机械化会使运算步骤变得简单，达到以最少思维获得最佳结果的效能。正是由于笛卡尔看到代数方法拥有的巨大力量，出于一种对方法论的强烈兴趣，笛卡尔才着手把代数用于几何的伟大工作，写出《几何学》。
	
	变量的思维首先在笛卡尔《几何学》中引入的，但他没有使用变量这个术语。他称一些量为“未知和未定的量”，就相当于现在的变量。
	
	笛卡尔《几何学》第二卷中有这样一个例子：
	
	如图\ref{fig:p11}，设直尺$GL$一端固定于$G$点，绕$G$点旋转，$AK\bot GA$。边$BK$位于直线$AK$上，可以上下移动，使直尺通过三角形边上固定点$L$，求$GL$与三角板$CK$边（或延长线）交点$C$轨迹。
	
	\begin{figure}[!h]
	    \centering
		\includegraphics[scale=0.67]{P11}
		\caption{示例}
		\label{fig:p11}
	\end{figure}
	
	笛卡尔选择直线$AB$作为量点位置标准，$A$作为始点（现代术语写作$AB$作为坐标轴横轴，A是坐标轴原点）。
	
	作$NL\sslash CB\sslash  GA$，他写道：“因为$CB$和$BA$是两个未知和不确定量，故命名为$y$和$x$”。
	
	命名$GA=a$，$KL=b$，$NL=c$，因为$c:b=y:BK$，故$BK=\dfrac{b}{c}y$，$BL=\dfrac{b}{c}y-b$，$AL=x+\dfrac{b}{c}y-b$。
	
	又$CB:BL=y:(\dfrac{b}{c}y-b)=GA:AL=a:(x+\dfrac{b}{c}-b).$故$\dfrac{ab}{c}y-ab=xy+\dfrac{b}{c}y^2-by$，轨迹方程是
	
	\[
	y^2=cy-\frac{cx}{b}y+ay-ac.
	\]
	
	笛卡尔称该曲线为双曲线。
	
	我们从中可以看出笛卡尔是怎么引入变量的。
	
	毫无疑问，引入变量对数学发展有很大影响，为此，恩格斯对笛卡尔工作给予极高评价，他说：“数学中转折点是笛卡尔的变数，有了变数，运动进入数学，有了变数，辩证法进入数学，…”
	
	数理逻辑是怎么产生的？
	
	数理逻辑是数学和传统逻辑学相结合的产物，在其中，人们用数学符号研究数学各个领域公共使用的逻辑推理，简单来说，就是把传统逻辑加以符号化，所以又得名符号逻辑。
	
	传统逻辑主要指亚里士多德逻辑，尤其是经过中世纪漫长演变，一直沿用至19世纪乃至现代。由于这种逻辑以推理形式，也是以命题形式作为研究对象，所以称之为形式逻辑。
	
	数理逻辑创始人为莱布尼茨。他想建立一种符号和术语体系，便于简化和整理逻辑推理的基本要素。他在著作《组合术》中提出建立普遍的推理演算系统的计划和设想。他试图把代数学符号和演算应用到推理过程，这就开创数学和形式逻辑相结合的先例，因此，一般认为他是数理逻辑创始人。
	
	19世纪中叶，数理逻辑产生两个发展方向。
	
	第一个方向是逻辑代数化方向。该方向主要是把初等代数和形式逻辑相结合，突出人物是布尔（1815-1864年）。他在1847年发表论文《逻辑的数学分析，论演绎推理的演算》，1854年他又发表《思维法则的研究，逻辑和概论的数学理论的基础》。布尔正式提出改革传统逻辑的主张和具体方案，其基本思想和莱布尼茨一脉相承，即试图通过语言的符号达到逻辑严格化，因此，他致力于把推理过程的思维法则表述成符号语言的演算法则。因此，布大家承认他是继莱布尼茨之后的数理逻辑第二创始人。
	
	布尔所从事的工作是莱布尼茨未完成的工作，即仿照数学的方式发展逻辑。他的研究成果便是今天有名的布尔代数。布尔证明代数演算和逻辑演算现在着形式上的类似之处。
	
	布尔代数的创立，是数理逻辑宣告诞生的主要标志。布尔代数主要分为两部分内容：集合代数和命题代数，都是现代数理逻辑基本部分。布尔代数当时纯粹是一种理论研究成果，后来发展出开关代数，在组合电路、电路网络等方面应用广泛。
	
	第二个方面是数学逻辑化方向，主要工作是和研究数学基础问题相联系。由于数学发展，特别是以解析几何和微积分为发端的近代数学的发展，加上两千多年以来对第五公设的研究，在18世纪末，数学逻辑证明的严格性问题被提到突出地位。当时，整个数学基础问题的研究，基本上是围绕着数学原始概念的精确性和数学逻辑证明的严格性来进行的。
	
	数学逻辑化突出人物是弗雷格，他是当时首屈一指的数理逻辑家。他不仅完整发展数理逻辑基础--命题演算，而且部分发展数理逻辑另一个基础--谓词演算，需要特别提到：他还把数理逻辑和数学基础问题紧密联系起来。当时，数理逻辑基础在弗雷格手中已接近完成，有人把他看做数理逻辑第三创始人。可惜，弗雷格的符号和历来相传、当前使用和迄今使用的都完全不相同，以致他的书未受到当时人们的注意，学说也无人理睬。
	
	这方面另一位突出人物是意大利数学家皮亚诺，他从语言方面和逻辑方面对数学基础问题进行研究。力图把数学建立成一个 自足的形式系统。为此他对古希腊流传下来的公理方法加以改进。为保证理性思维发挥作用，防止不自觉地诉诸经验和观念，皮亚诺提出两个方法：（1）不使用自然语言，采用一种符号语言；（2把数学推理形式写成符号公式。本质上就是把数学语言和数学推理形式化。数学理论从此以一种新形式出现：
	
	第一，每个数学理论只包含少数集合原始概念，可以用原始符号表示。
	
	第二，每个数学理论只包含少数几条原始命题，用符号导出公式表示。
	
	第三，数学理论逻辑展开，完全变成符号公式数学推演。
	
	当今所用数理逻辑记号大体上是由皮亚诺制定的，他的关于自然数论的三个概念和五个公理一直沿用至今。成为自然数论的出发点，是数学理论形式化的一个杰出成果。
	
	皮亚诺作为数理逻辑完成者，却未能好好完成总结。严格来说，完成者是罗素。不过这已经是20世纪的事情了。罗素继承皮亚诺的研究，又进一步将符号逻辑和古典数学系统地紧密联系起来。罗素和怀特海合著《数学原理》，是当时为止数理逻辑成就的总结，是数理逻辑发展史上一部划时代的著作。
	
	之后，数理逻辑进入蓬勃发展时期，其种种成果已经不足以用“数理逻辑”作为总标题。
	
	“几乎每一个数学分支都依靠一种数学语言而生存”，几乎数学每一个分支都离不开数学符号化。
	
	\section{符号美学魅力推动数学发展}
	“那里有数学，那里就有美”。数学有其自身的美。著名法国数学家阿达玛写过一部《数学方面的发明心理学》，书中曾发挥了数学家、天体物理学家彭加勒关于数学发明创造的学说，他们一致认为，数学事实间的最佳组合往往依靠“审美直觉”来作出的，没有美感的人，不可能成为数学发明家。著名英国数学家哈代曾说：“现在也许难以找到一个受过教育的人对数学美的魅力完全无动于衷”。
	
	数学美的魅力是数学发展的深层驱动力。数学语言是符号组成的，数学美的魅力主要来源于数学的符号美。
	
	\subsection{数学符号美主要标志}
	数学符号美主要标志--简单性、统一性、对称性与奇异性等在数学符号方面都均有反映。
	
	“数学语言不仅是最简单和最容易理解的语言，而且也是精炼的语言”。简单性是数学符号美最突出的标志。
	
	数学符号的简单美绝不是指简单、单薄和初等；而是要用简单的公式概括大量的事实，因而，这种简单同时就显得深远，显出数学符号美。哲学家罗森在评价爱因斯坦时指出：“在构造一种理论时，他所采取的方法和艺术家所用方法具有某种共同性：他的目的在于求得简单性和美（而对他来说，美在本质上终究是简单的）。”例如质能公式
	\[
	E=mc^2
	\]
	（其中$E$为能量，$m$是静止质量，$c$是真空光速）深刻地揭示微观、宏观和宇观无数质能变化现象的规律，但公式式子极其简单。优秀诗词往往以最精炼的文字表达出最丰富的内容。质能公式用字极少，但表达内容极其丰富，远非任何诗句所能够比拟的，给人以深刻的美的享受。在我国发行爱因斯坦纪念邮票上，印刷过这个简洁完美的公式，它代表了这位伟大的科学家对人类贡献的精华。
	
	莱布尼茨曾用$\int  f(x)\mbox{d}x$这个简洁的符号表达积分概念的丰富思想，刻画出“人类精神的最高胜利”，因此，有些人把微积分比喻成“美女”。
	
	事实上，自然界很多现象都可以归结为数学的一个公式、一个方程或一个函数关系式，都充分显示数学符号具有的简单美。
	
	统一性与简单性有密切关系。也是数学符号美主要标志。英国数学家、菲尔兹奖获得者阿蒂亚曾说：“数学中简单性和简洁性的考虑，都是极为重要的。研究数学目的之一，就是用简洁而基本的词汇描述世界。归根结底，数学研究是人类智力活动，而不是计算机程序。如果我们希望把人类积累的知识代代相传，我们就必须努力把知识加以简化和统一”。
	
	直线、圆、椭圆、抛物线和双曲线在直角坐标系有不同方程来描述，引入极坐标后，这些曲线竟然统一为极坐标方程
	\[
	\rho= \frac{ep}{1-e\cos\theta}.
	\]
	其中$e$表示离心率，$p$为焦点到准线距离。真是令人赞叹。
	
	对称是一种美。从古希腊时期起，对称美就被认为是数学美其中一个基本内容。著名德国物理学家和数学家韦尔说：“美和对称紧密联系”。韦尔与段学复都曾写过关于“对称”的专著，令人读之赏心悦目。许多数学符号都呈现出对称美。例如，对称多项式、对称矩阵，代数化简时共轭因子；代数方程虚根成对出现，线性方程组克莱姆法则等都给人一种对称性美感。数学公式例如秦九韶-海伦公式、平均不等式、赫尔德不等式、二项式定理、韦达定理、莱布尼茨公式和分部积分公式等都具有某种对称性。
	
	奇异的东西给人以美感，奇异之极是极美。英国哲学家培根说，没有一个极美的东西不是在和谐中有某些奇异。数学奇异美也体现在数学符号方面。
	
	众所周知，数学中有五个较突出数。即0，1，$i$，$e$，$\pi$。在第\ref{cha:cha51}章中我们将看到，$\pi$研究历史极为久远，要弄清楚它底细是很不容易的。$e$作为近代发现的超越数，是普遍使用对数--自然对数底。
	
	1，0代表算术，$i$代表代数，$\pi$代表几何，$e$代表分析，5个特殊数字却被被欧拉用一个极简单公式
	
	\[
	e^{\pi i}+1=0
	\]
	把它们紧密联系起来了。这个公式充分揭示了数学分支内在联系和统一性。真是神奇绝妙。在数学家看来，这的确是数学美象征之一。
	
	研究素数分布规律，一直是数学家很感兴趣的事情。为此，人们努力寻找素数在全体自然数中的分布信息。
	
	对于自然数$n$，设$A_n$表示$n$个整数$1,2,3,\cdots,n$中素数个数。高斯在实验和观察基础上提出猜想：比值$A_n/n$渐进等于$1/\ln 1$，就是说：
	\[
	\lim_{n\to\infty}\frac{A_n/n}{1/ \ln n}=1.
	\]
	记作：$\dfrac{A_n}{n}\sim\dfrac{1}{\ln n}.$
	
	素数分布平均状态竟然可以用对数函数描述，这是一个很引人注目的发现。因为两个看似无关的数学概念竟然在事实上有如此紧密的联系，确实是很令人奇怪的。果然，一百多年后，人们证实高斯的猜想。成为数学中最著名的发现之一。
	
	18世纪前期，人们普遍认为，函数连续性可以保证可微性，18世纪后期，数学家认为，连续函数至少在某些点可微，然而，德国数学家维尔斯特拉斯在1872年一次演讲中给出一个处处连续却不可微函数：
	\[
	f(x)= \sum_{n=0} ^\infty a^n \cos(b^n \pi x)
	\]
	其中$0<a<1$，$b$为正奇数，使得$ab > 1+\dfrac{3}{2} \pi.$
	
	当时，曾有人批评这个函数是“无意义的”，是“离奇古怪的”，是“病态函数”，是函数中“不健康部分”，破坏“数学天堂的优美”，于是，有人“痛惜”，有人“惊恐”，有人“厌恶”。出现这种情况不足为奇，因为，数学美是“理智美”，“内在美”，“逻辑美”，领悟数学美是需要一定的数学素养的，还要有一个认识过程。历史证明，正是类似“奇异”函数的提出，人类认识到连续函数不一定可导，不连续函数可以求积分等重要结论，促进数学分析的发展。{\fangsong 导致分形几何等学科产生。}
	\subsection{追求美导致发现}
	科学给人以美感，科学家的美感直接影响科学创造。
	
	科学创造，除了反映世界，还源于对于美的追求。“美的概念在对核对结果和发现新规律中被证明是非常宝贵的”，衡量一个科学理论是否成功，不仅有实践（实验）标准，传统逻辑标准，而且也有审美标准。追求科学美，常常为科学家提供重要线索和有力手段。科学史家库恩指出，新理论建立中美对美的直觉的重要性有时候是决定性的。麦克斯韦建立电磁理论过程中，依据法拉第实验研究结果，把电磁理论方程写作
	\[
	rotE=-\frac{1}{c}\cdot \frac{\partial H}{\partial t}
	\]
	和\[
	rotH=0
	\]
	当然，等式是左右不对称的。麦克斯韦从美学考虑出发，将第二个方程改为
	\[
	rotH=\frac{1}{c}\cdot\frac{\partial E}{\partial t}.
	\]
	他这么做，并没有任何实验依据，但却使电磁理论在数学符号形式上更加优美，并导致一系列两人陶醉的结果。后来，改写的方程被实验证实是正确的。电磁理论决定性的一步就是这样跨出的。
	
	韦尔曾说：“我的工作总是力图把真和美统一起来，但当我必须选择一个时，我选择美”。对于韦尔的中微子两分量相对论波动方程。物理学家多年未曾理睬，但韦尔凭借直觉相信它。结果，韦尔正确。
	
	追求数学美是狄拉克一生科学活动内在驱动力之一。他认为：“如果物理方程数学形式不够美丽，则标志着一种不足，意味着理论存在缺陷，需要加以改进，有时候数学美比实验结果相符更重要”。因为数学美能够反映自然基本规律，而实验是否符合可能与一些细节有关。1927年，狄拉克认为克莱茵方程不够完美，无论是逻辑上还是数学上都有待完善。为了得到合乎逻辑的理论，狄拉克试图建立一种对时间和空间坐标来说都是线性的微分方程，正是这种电子波动方程可以导出自旋和磁矩正确性。狄拉克这个发现纯粹基于追求数学美。事前未曾想要到给出电子这种物理性质。
	
	人心灵深处感受到美，后来竟然在外部世界得到实践。这是科学发现中最使人觉得惊异的现象之一。美感在科学发现中之所以能取如此之大作用，首先由于真和美之间存在微妙的统一关系。美的一些标志，深刻反映未知真理的若干特征。科学家凭借美的直觉有可能在理智抓住真理前，先领悟到其中显现的美。一个具有很强美学敏感性科学家的发展的新理论，即使在公布初期看起来不够真实，但最后却很有可能是正确的。
	
	美对于发现真的意义在任何时代都得到承认和重视。“美是真理的光辉”这是一句拉丁语格言，告诉我们，“探索者最初凭借这种光辉，借助它来照亮和认识真理”。
	
	\subsection{科学发展推动力}
	数学符号美学魅力是科学发展的推动力。
	
	数学符号简单性是数学家主要追求目标。拉丁格言“简单是真理的标志”以大字刻在哥廷根大学物理报告厅里，作为给那些即将发现新事物的人的告诫。所谓“简单性原理”是科学家有意识或潜意识所遵循的一种方法或法则。历史表明，数学符号都遵循“简单性原理”进行革新。例如：
	\[
	\underbrace{a+a+\cdots+a}_{n\mbox{个}}\xrightarrow{\mbox{简化}}n\times a
	\]
	\[
	\underbrace{a\times a\times\cdots\times a}_{n\mbox{个}}\xrightarrow{\mbox{简化}}a^n
	\]
	\[
	\lim_{\Delta \to 0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}\xrightarrow{\quad} f^{\prime}(x_0)
	\]
	等等。
	
	数学家傅立叶创立“傅立叶级数”时，也进行过有关简单性的考虑。正如他说：“每个数学函数无论多复杂，都可以表示为某些简单函数和”。傅立叶这个研究成果不仅对偏微分方程积分数学方法很有启发，而且对函数概念发展也起促进作用。恩格斯说：“黑格尔是一首辩证法的诗，傅立叶是一首数学的诗”。
	
	二进制也可以说是从数字表达的简单性考虑所引出的产物，它推动了电子计算机技术的发展。是计算数学的一场革命，不仅对数学发展创造了一个新领域，而且对整个自然科学发展都将产生十分深远的影响。
	
	数学各种最简形式（如最简多项式、最简分式和最简根式等）均是源于对简单性的追求。
	
	与最简形式相关，数学中各种标准形式也源于对简单性的追求。
	
	几乎可以说，数学家对各种解析式、函数、方程等符号总想设法追求最简形式和标准形式。毫无疑问地推动数学向前发展。
	
	对美的追求同时推动了方法论发展，所谓“补美法”就是典型事例。
	
	对于美感与发现，创造心理学工作者致力于创造者心理分析，揭示美感作用，方法论工作者概括出补美原则。
	
	什么是补美法？美容师就从事类似工作。不过，科学家补美工作是层次最高的，按照科学基本内容来补美。当一个科学理论还未达到完美境界时，就必须继续进行创造和发展，“按照美的规律进行创造”过程体现方法称为“补美法”或“臻美法”。麦克斯韦实际上使用过“补美法”。
	
	数学是自然科学的“皇后”，科学补美法需要考虑数学美，即需要按照数学美基本内容来进行补美。
	
	我们根据椭圆定义，建立椭圆基本方程。是高中教科书内容，我们作为阐明补美方法例子。
	
	平面上两点$F_1$和$F_2$距离和是常数$M$（大于$F_1F_2$）轨迹（或集合）称作椭圆。两个定点称为焦点。
	
	如图，过点$F_1$和$F_2$做直线$x$,线段$F_1F_2$中点作原点$O$，作直线$y$，过点$O$建立直角坐标系。设焦点距离为2$c(c>0)$，则点$F_1$坐标是$(c,0)$，点$F_2$坐标是$(-c,0)$。
	
	设点$M$是椭圆上任意点，点$M$到点$F_1$和$F_2$距离和用$2a$表示，根据椭圆定义，可得
	\[
	|MF_1|+|MF_2|=2a.
	\]
	即
	\begin{equation}\label{eq1}
	\sqrt{(x-c)^2+y^2}+\sqrt{(x+c)^2+y^2}=2a
	\end{equation}
	方程\ref{eq1}可以作为椭圆公式，但明显有待优化。即不符合数学美“简单性要求”，需要化简为
	\begin{equation}\label{eq2}
	(a^2-c^2)x^2+a^2y^2=a^2(a^2-c^2)
	\end{equation}
	两边同时除以$a^2(a^2-c^2)$，得
	\begin{equation}\label{eq3}
	\frac{x^2}{a^2}+\frac{y^2}{a^2-c^2}=1
	\end{equation}
	方程\ref{eq3}明显比方程\ref{eq1}简明，但是，还是不够符合数学美要求。椭圆具有对称性。方程也应该独有类似对称性。对称性一直是数学家追求的目标。现代数学，考察对称性是数学研究重要美学指导思想。韦尔说：“对称性不管你是按照广义还是狭义来定义，含义总是含有一种多少时代以来人们试图以领悟和创造秩序美和完善性的观念”。对方程\ref{eq3}进一步化简，因为$a^2-c^2>0$，令
	\[
	a^2-c^2=b^2(b>0)
	\]
	代入方程\ref{eq3}，得
	\[
	\frac{x^2}{a^2}+\frac{y^2}{b^2}=1
	\]
	即椭圆标准方程。$a$是长半轴长，$b$是短半轴长。
	
	根据上面示例可以看出，根据数学美要求采用补美法引入参数$b$，有很鲜明的几何意义，而且符合对称性要求。体现美与真具有统一性。著名数学家鲁滨逊说：“纯粹数学很大程度上是由我们关于数学美以及纯粹数学重要性的含糊直觉来调整的”。
	\subsection{某些符号刺激数学发展}
	某些数学符号和表达式具有神奇的诱惑力，为了对它们进行定性或定量研究，几百年来，吸引成千上万数学家为之奋斗，如此，不仅有力的促进问题本身解决，还推动了数学思想的发展，促进数学方法革新。
	
	且不说“哥德巴赫思想”怎么令人着迷，本书只讲“$\pi$”。
	
	人类已经证明，圆周长和直径比值是一个和圆大小无关的常数，称之为圆周率。
	
	1600年，英国人威廉·奥托兰首先使用$\dfrac{\pi}{\delta}$表示圆周率，他的理由是，希腊文中$\pi$是“圆周”一词首字母，$\delta$是“直径”一词首字母，根据圆周率定义，应该使用$\dfrac{\pi}{\delta}$表示圆周率，但是在推算过程中，人们经常令圆半径为1，即令$\delta=1$，于是$\dfrac{\pi}{\delta}$等于$\pi$。最早使用希腊字母$\pi$代表圆周率，是英国威尔士数学家威廉·琼斯，他于1706年出版著作《Synopsis Palmariorum Matheseos; or, a New Introduction to the Mathematics》中首次使用$\pi$。1737年，欧拉在著作中使用$\pi$作为圆周率符号，被数学家广泛接受，并沿用至今。
	
	$\pi$是一个重要和常见数学常数，在数学和自然科学中应用极为广泛。计算圆周长和面积，计算球、球缺、球台、圆柱、圆锥或圆台等旋转体表面积或体积等等都需要使用$\pi$。
	
	伽利略研究钟摆时发现单摆周期具有公式
	\[	T=2\pi\sqrt{\frac{l}{g}}.	\]
	库伦研究两个带电质点相互作用时，有
	\[	F=\frac{1}{4\pi e}\cdot \frac{Q_1Q_2}{r^2}.	\]
	高斯研究测量误差分布时，得到“正态分布”密度函数：
	\[	f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{- {{(x-\mu )^2 \over 2\sigma^2}}}\]
	如此等等，不胜枚举。难怪有人说$\pi$在数学中扮演者“不可一日无此君”的重要角色。
	
	$\pi$精确值到底是多少？数学史表明，很多国家都很重视计算圆周率值。一位德国数学家评论道：“历史上一个国家计算$\pi$值准确程度，可以作为衡量这个国家当时数学发展水平的标准”。数学家们努力尝试寻找一个表示$\pi$值的分数，但均宣告失败。1794年，勒让德证明$\pi$是无理数，无法用两个整数比值表示。1882年，德国数学家证明$\pi$是超越数，即不是整系数代数方程根。尽管如此，许多数学家仍在孜孜不倦寻找圆周率的计算方法。
	
	古希腊数学家阿基米德最早给出圆周率理论计算方法。采用外切和内接正多边形，从两边逼近理论值。采用穷竭法巧妙求得
	\[
	3\frac{11}{71}<\pi<3\frac{1}{7}.
	\]
	公元前150年左右，古希腊数学家托勒密用弦表法给出$\pi$近似值3.1416。
	
	公元200年，中国数学家刘徽用“割圆术”推算$\pi$值。尽管结果未能超越托勒密，但是他在方法论上作出了划时代的成就，割圆术同时体现极限观点。刘徽和阿基米德略有不同，只采用内接方法，不采用外切方法，利用圆面积不等式计算出结果，起到事半功倍的效果。公元480年，中国数学家算得
	\[
	3.1415926<\pi<3.1415927
	\]
	，祖冲之的这一结果精确到小数点后第7位，求得“约率”$\dfrac{22}{7}$和“密率”$\dfrac{355}{113}$，可惜计算方法早已失传，人们推测采用过刘徽割圆术。直到一千多年后才由15世纪阿拉伯数学家阿尔·卡西以17位有效数字打破此记录，他分别计算圆内接和外切$3\times2^{28}$边形周长。
	
	采用正多边形边长求面积方法求圆周长或面积，毕竟存在很大局限性，工作量很大。突破点在于寻找解析表达式。1759年，法国数学家韦达发现关系式
	\[
	\frac{2}{\pi}=\sqrt{\frac{1}{2}}\cdot\sqrt{\frac{1}{2}+\frac{1}{2}\sqrt{\frac{1}{2}}}\cdot\sqrt{\frac{1}{2}+\frac{1}{2}\sqrt{\frac{1}{2}+\frac{1}{2}\sqrt{\frac{1}{2}}}}+\cdots
	\]
	虽然这个计算公式实际计算会遇到多次开方的巨大困难，但该方法首次不再使用原有采用几何学的陈旧计算方法，开创出新方法。
	
	1650年，瓦里斯采用无穷乘积形式
	\[
	\frac{\pi}{2}=\frac{2}{1}\cdot\frac{2}{3}\cdot\frac{4}{3}\cdot\frac{4}{5}\cdot\frac{6}{5}\cdot\frac{6}{7}\cdot\frac{8}{7}\cdot\frac{8}{9}\cdots
	\]
	莱布尼茨发现
	\[
	\frac{\pi}{4}=\frac{1}{1}-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\frac{1}{9}-\cdots
	\]
	欧拉证明
	\[
	\frac{{\pi}^2}{8}=\frac{1}{1^2}+\frac{1}{3^2}+\frac{1}{5^2}+\frac{1}{7^2}+\cdots
	\]
	上面几个公式看起来不是很复杂，但用于计算$\pi$，工作量还是过于巨大。
	
	1777年，法国数学家蒲丰提出著名投针问题，采用概率方法计算$\pi$值，平面上有两条距离为$a$平行线，平面上投掷长度为$l$针$(l<a)$，投掷次数为$n$，针和任意一条平行线相交次数为$k$，则有
	\[
	\pi=\frac{2\ln}{ak}
	\]
	计算方法很具有理论意义，1901年，有人投针3408次算得$\pi=3.1415926$。如果把针长取作$l=\d  frac{a}{2}$，计算将简化为$\pi=\dfrac{n}{k}$，用本方法计算$\pi$值，工作量不是很大。尽管计算精确度上没有超过其他方法，但具有方法论意义。从此，引入一种方法：建立一个模型，引入一个我们感兴趣的量（通常是$\pi$），设计适当的随机试验，并通过实验结果确定这些量。
	
	随着计算机技术的发展，现在，人们根据上述思想，建立起一种新方法--蒙特卡洛方法。
	
	计算$\pi$方法取得突破在于使用反正切函数表达式。
	
	1671年，苏格兰数学家格列哥里发现无穷级数
	\[
	\arctan x=x-\frac{x^3}{3}+\frac{x^5}{3}-\frac{x^7}{7}+\cdots\qquad (1<x\leqslant 1).
	\]
	1706年，英国数学家麦欣首先发现
	\[
	\pi=\arctan \frac{1}{5}-4\arctan\frac{1}{239}.
	\]
	上述公式计算$\pi$速度大幅提升，远远超过古典算法。
	
	紧接着，勒让德、高斯等数学家相继发现一系列有关$\pi$与反切函数的关系式，利用反切函数无穷级数展开，使得$\pi$值计算迅速突破100位大关。
	
	2011年IBM蓝色基因 P超级计算机算出${\pi}^2$有效值精度为260,000,000,000,000位二进制小数。
	
	对于实际应用来说，现代科学技术使用$\pi$一般情况下只取到10位小数。普通工程或天文运算不需要用到$\pi$成千上万位精度值，因为精度为40位$\pi$已经足以计算误差小于一个质子直径大小银河系周长。现今高精度$\pi$主要应用于计算机软硬件测试，用不同算法计算$\pi$而计算结果误差大代表计算机系统可能出问题。同时创造更强有力的计算方法。也可以用来验证统计$\pi$各位数字是否具有某种统计学规律，比如是否具有“正态性”。
	
	竞争还在继续，正如有人说，科学家探索进程也像$\pi$，永不循环，无休无止…，以上也仅仅是计算圆周率历史的冰山一角，但已经反映一个事实：$\pi$刺激着数学机体的多种神经，促进数学机体发展 。
	\subsection{某些符号有“特异功能”}
	“在数学符号中好像存在一定量的能量，释放出来可以产生几乎是爆炸性的威力。这就像强大的发动机，我们借助它竖起智力的结构。如果没有这种支持，我们的能力就无法进入这种结构。”
	
	“有些数学符号似乎具备一种神奇的力量”。	
	
	以上种种说法，基本思想都说明数学符号，尤其是某些特殊数学符号具有“特异功能”，可以推动数学发展。
	
	本书以一个字母数学符号--$e$（自然对数底）为例加以阐明。
	
	大家熟知$e$是数列$\{(1+\frac{1}{n})^n\}$极限，即
	\[	e=\lim_{n \to \infty}(1+\frac{1}{n})^n.	\]
	然而，这个数列是怎么被发现的呢？想必也是众多读者很关心的问题吧。这个问题和对数的发现有关。
	
	对数是苏格兰数学家约翰·纳皮尔(John Napier)在1614年他的著作《奇妙的对数定律说明书》（《Mirifici Logarithmorum Canonis Descriptio》）中首次公开提出的。同时Joost Bürgi独立发现对数，但直到到纳皮尔著作发表4年后才公开发表。
	
	当时，指数概念尚未出现，纳皮尔花费20年心血，编制出世界上首部对数表，实际为正弦对数表。纳皮尔对数相对于底数为
	\[	(1.0000001)^{10000000}	\]
	对数，底数可以写作
	\[	(1+\frac{1}{10000000})^{10000000}	\]
	形式，可见纳皮尔实际上已经差点接触到数列$\{(1+\dfrac{1}{n})^n\}$。
	
	把数列$\{(1+\dfrac{1}{n})^n\}$作为对数底数，$n$越大，真数间隔越小，对编制对数表越有利。人们自然而然想到一个问题：用$n$无限增大，即数列极限
	\[	\lim_{n\to \infty}(1+\frac{1}{n})^n	\]
	作为对数底岂不更好？
	
	数学家已经证明数列极限的确是存在的，而且是无理数。不可能写出准确数值。因此，需要引入符号表示。1727年，欧拉首先使用$e$表示自然对数底。
	即
	\[e=\lim_{n\to\infty}(1+\frac{1}{n})^n.\]
	
	符号$e$“出身非凡”，无论是理论还是实用上，$e$都有特殊的重要地位。
	
	以$e$为底对数称为自然对数，通常底数$e$不再写出，简写为$\ln x$，相当于$\log_e x$。
	
	果然，引入$e$后，对编制对数表有显著效果。利用下面的级数可以很方便地编制对数表。
	
	由
	\[	\ln(1+x)=x-\frac{x^2}{2}+\frac{x^3}{3}-\frac{x^4}{4}+\cdots \qquad (-1<x\leqslant 1)	\]
	\[	\ln(1-x)=-x-\frac{x^2}{2}-\frac{x^3}{3}-\frac{x^4}{4}-\cdots \qquad (-1\leqslant x<1)	\]
	得$\ln\dfrac{1+x}{1-x}=2(x+\dfrac{x^3}{3}+\dfrac{x^5}{5}+\cdots)$，$(-1<x<1)$，设$k$是自然数，命$x=\dfrac{1}{2k+1}<1$，则
	\[	\frac{1+x}{1-x}=\frac{k+1}{k}	\]
	\[	\therefore \qquad \ln\frac{k+1}{k}=2(\frac{1}{2k+1}+\frac{1}{3(2k+1)^3}+\frac{1}{5(2k+1)^5}+\cdots)	\]
	或
	\[	\ln(k+1)=\ln k+2(\frac{1}{2k+1}+\frac{1}{(3k+1)^3}+\frac{1}{5(2k+1)^5}+\cdots)	\]
	根据该公式，从$\ln1=0$出发，可以循环计算出所有自然数的自然对数。比如要精确到6位有效数字，只需要取括号内前6项就可以了，但是考虑到循环计算有累积误差，所以实际计算需要多取几项。
	
	可见，有$e$以后，对数表编造速度就大大加快，如果需要编造常用对数表，可以利用自然对数表，按换底公式计算相应常用对数值。
	
	对数对科学进步有很大贡献，特别是对天文学，使某些复杂计算成为可能。在计算器和计算机发明以前，对数被持久用于测量、航海、和其他实用数学和物理分支。纳皮尔是当之无愧的“对数缔造者”，法国著名数学家、天文学家拉普拉斯（Pierre Simon Laplace）曾说：“对数，可以缩短计算时间，在实效上等于把天文学家的寿命延长了许多倍。”
	
	$e$另外一个显赫功绩是帮助人们证明$\pi$的超越性，从而彻底解决了“化圆为方”问题。
	
	数学史家曾指出，整个数学史，很难找出像三大尺规作图难题那样具有经久不息的魅力。二千多年以来，无数聪明才智倾注在这几个问题却丝毫得不到任何结果。实际上这三个问题都是不可能用尺规有限次作图来解决的。1637年笛卡尔创立解析几何，尺规作图可能性才有了准则。1837年凡齐尔（1814-1848年）证明“三等分任意角（特殊角除外）”及“倍立方”都是不可能的，然而，关于“化圆为方”问题解决却仍有很大麻烦。化圆为方问题问题中涉及到$\sqrt{\pi}R$这样的几何量，要解决化圆为方问题，需要对$\pi$作定性研究，即$\pi$是不是超越数？
	
	一个数，如果不是任何整数系代数方程根，称做超越数。“超越数”一次是欧拉首先引入的，意思是这种数“超越代数方法的能力”。不过欧拉并未给出任何具体超越数，直到1844年，法国数学家刘维尔构造出第一个超越数，证明超越数确实存在。其实，人们都知道，超越数比代数数还要多很多。埃米特说：“我不敢试着证明$\pi$超越性，如果其他人承担这项工作，对于他的成功没有比我再高兴的人。”1882年，德国数学家林德曼在埃米特证明$e$是超越数基础上，借助欧拉公式$e^{i\pi}+1=0$，证明$\pi$是超越数。
	
	知道$\pi$是超越数。化圆为方问题问题“迎刃而解”。由解析几何可以知道，一个几何图形可以用尺规作出，必须并且只需要其中所要作出几何量可以由给定几何量经过有限次四则运算和开平方获得。因为$\pi$是超越数，不可能由$R$经过有限次四则运算和开方获得$\sqrt{\pi}R$，所以用尺规作图来化圆为方问题是不可能的。
	
	由于$e$，这个两千多年的悬案宣告彻底结束。
	
	人们对于数$e$真正认识，是在17世纪中叶，数学家发现双曲线面积和自然对数关系
	\[
	\int_1^a \frac{1}{x}\,dx=\ln1
	\]
	以后，那时，人们逐渐了解到很多重要函数、极限，微分与积分都和数$e$有密切关系。自然对数求导运算特别方便，所以理论研究时宁愿采用自然对数而不是常用对数。另一方面，很多具有复利率现象中，人们研究量变化时，往往由$A\cdot(1+\frac{n}{100})^k$型结构式，经过极限过程和$e$相联系，很多自然规律都表现为$e$为底指数形式。
	例如
	
	大气压压力$P$和高度$h$关系为
	\[
	P_h=P_0e^{-Lh}
	\]
	%电容器放电电压$V$和时间$t$关系为
	%\[V_t=V_0\]
	等等。
	
	正是如此，$e$和$\pi$都成为特别重要的无理数。几乎每一本微积分读本，哪怕是最简单的，几乎都要介绍到$e$，同时把$\lim_{n\to \infty}(1+\dfrac{1}{n})^n$作为基本极限之一。
	
	科学史表明，数$e$特异功能不仅仅推动数学发展，而且影响到其他科学技术的发展。
	
	众所周知，发射卫星或宇宙飞船，需要用到火箭，在这个问题中，同要需要$e$。
	
	俄国科学家发现，火箭运动速度可以用方程
	\[	V=\upomega \ln Z \]
	其中$V$是火箭理想速度，$\upomega$是火箭发动机排气速度，$Z$是火箭初始质量和发动机停止时质量比。
	
	火箭最终速度至少需要达到第一宇宙速度（约8千米每秒）才能将人造卫星送入运行轨道。方程表明，火箭速度取决于喷气速度和质量比。
	
	当前，混合气体原料可以使喷气速度达到4km/s，同时质量比一般也未超过10，按照$\upomega=$4km/s，$Z=100$理想情况下计算，火箭理论速度可以达到有9km/s，但除去空气阻力和重力影响造成损失（约为2km/s）后，火箭实际速度只有7km/s，尚未达到第一宇宙速度，人造卫星将无法被送入运行轨道。
	
	科学家研究火箭运动方程，可以找到提高火箭速度的方法，即采用多级火箭。由多个火箭系统组成一个动力系统推动火箭前进。第一级发动机使火箭达到一定初速度，燃料耗尽自动脱落，第二级发动机点火开始工作，提高火箭速度，燃料耗尽自动脱落，开启第三级火箭，以此类推，不过，一般应用最大火箭级数不超过3级。
	
	假设各级火箭喷气速度和质量比均相同，则火箭最终速度$v=n\upomega\ln Z$。即在理想条件下每增加一级火箭，火箭末速度增加一倍。实际情况下，扣除各种速度损失，火箭可以轻松突破第一宇宙速度，将卫星送入轨道。
	
	$e$帮助人们揭示火箭运动规律，启发人类设计多级火箭，实现遨游太空理想。
	
	数学家苏顿写到：“有这样一个奇怪想法，数学所使用的少量符号，没有什么意义的纸上记号，居然对生活的模样作出世人所知如此多的贡献。如果一个中世纪学者现在又醒来，他将会认为这些符号是诅咒的魔力公式，如果念得对，就会给人类以战胜自然的力量”。
	
	很显然，这些奇思怪想并不奇怪，它是客观现实的反映。
	
	\chapter{数学符号思维功能}
	数学符号的动力作用是由数学符号内在思维功能所决定的。动力作用是思维功能的外显形式。
	
	符号和数学思维有密切关系。数学符号是数学抽象思维产物，数学符号语言有助于思维。正如莱布尼茨所说：“记号是为了便于发现，它多半是在记号简介地去表示并能反映事物内在本质的时候，这时思维活动以惊人的方式得到简化…”。如果说，数学是思维的体操，那么，数学符号的组合则写成了“体操进行曲”。
	
	数学家苏顿曾提出一个问题：
	
	“我们根据我们自己规定的规则创造符号，那么在这种符号进行运算操作又怎样能揭示什么超出我们感觉的东西呢？换句话说，我们怎么能用数学去发现任何东西呢？”
	
	苏顿接着说：“上面提问都不像是我们这一代人能够给出满意答案的问题。我们至多只能给出答案的几条线索”。
	
	徐利治先生也提出过类似问题，为什么某些从不同角度确定的符号竟然会统一在一个极简单的关系式中呢？这种关系是否与人大脑数学思维机能和特性有关呢？他说，这显然是研究数学和思维关系的最诱人的问题之一。
	
	自从1980年钱学森教授倡导建立思维科学以来，研究思维规律和方法，已成为热门话题。研究数学符号思维功能是揭示大脑数学思维机能和特性的需要，本章将试图给出“几条线索”。
	
	\section{思维活动物质载体}
	
	数学符号是交流与传播数学思想的媒介，可以传递大量信息。
	
	数学符号是数学抽象物的表现形式，它有自己的思想内容。数学符号按一定规则组织起来，就成为数学思维活动的物质载体。人们通过用数学符号组成语言交流数学思想，认识数学世界的奥妙，并把数学成果应用于人类各种实际问题。
	
	数学符号载体功能大致体现三个方面。
	
	\subsection{表示一般规律}
	高度抽象性，可以保证应用具有广泛性。数学符号是抽象思维产物，可以用来表示一般数量关系及其变化规律。
	
	先看数字符号。
	
	数字符号“0”看起来很简单，却具有及其丰富的内容。
	
	在实数系、有理数系和整数系中均表示唯一一个中性数。
	
	“我有0元钱”，其中“0”表示“没有”。
	
	“今天气温是0摄氏度”，“0”表示气现在或某一时刻温高低程度，已经不是表示“没有”温度的意思。
	
	集合代数中，“0”表示集合元素。
	
	命题代数中，“0”表示“假”。
	
	此外，“0”还可以表示零点、零元、零向量、零函数、零环、零代数……
	
	在科学研究中，“宇宙之大或粒子之微”如果只依靠自然语言是难以表达的，必须依赖于数字符号。比如，光速数字表示是$3\times10^8$km/s，天文学中距离单位--光年数字表示是$9.46\times10^{15}$m，微观世界中，核子（如质子、中子等）直径约为$3\times10^{-15}$m。
	
	再看变元。
	
	变元可以替代一类符号中任意一个符号。字母$x$、$y$等可作为任意集合元素变元。以二次函数$y=2x^2$为例，它可以用来描述自由落体运动规律$S=\dfrac{1}{2}gt^2$；可以是计算动能与速度、质量的关系式$E=\dfrac{1}{2}mv^2$；可以描述圆面积$S=\pi r^2$。可以表示二次曲线；表示天体运动轨迹。也可以表示某圆锥面截线。
	
	要研究自然奥妙，进行抽象思维，揭示客观规律，必须使用比自然语言远为优越的形式化的符号语言。伽利略说宇宙这部书是数学语言写成的，其中是具有深刻道理的。从质子、中子、电子这些粒子运动，到月亮、地球、太阳这些天体之间的关系；从简单的机械运动，到复杂的化学变化；从逻辑思维的基本规律，到不容辩驳的推理和证明，无不可以用数字语言清晰、准确描述出来。
	
	例如，牛顿力学定律惯性定理、作用力与反作用力定律，万有引力定律可以用数学表达式分别表示为
	\[	F=ma \]
	\[	F_1=-F_2 \]
	\[	F=G\frac{M_1M_2}{r^2} \]
	以此为基础，可以描述太阳系中行星、卫星和卫星运动规律，完美解释地球上潮汐或其他天体运动\footnote{请上网搜索三体等天文学相关资料。}。
	
	当然，最典型、最突出的例子应该属于质能公式：$E=mc^2$。公式很简单，使用过很少的几个字符，却揭示了微观、宏观、和宇宙无数变化现象的规律。特别地需要说得的是，它揭示了原子的内部规律，使人们发现蕴藏在原子核内部的巨大能量，帮助人们发掘出取之不尽，用之不竭的能源--原子能。
	
	用华罗庚的话来说：“化工之巧，地球之变，生物之谜，日常之繁”均可用数学符号来描述。随着数学符号运用范围的日益扩大，很多科学家把数学符号的符号语言称为“科学语言”。
	\subsection{构造数学模型}
	数学符号可以用于构造数学模型。
	
	“只有在详尽给出现实世界的一个模型后，数学才能出场。数学的每一个应用都依赖于模型。”数学应用于实际关键在于用数学语言描述出所要研究的问题，使之构成一个数学问题，这个数学问题被称为研究对象的模型。现代，数学模型问题不仅是处理数学理论问题的一种经典方法，而且也是处理科技领域中各种实际问题的一般数学方法。
	
	笛卡尔在其著作《思维法则》中曾设计出一种“能解决各种问题”的“万能代数模型”。
	
	首先，把任何问题转化为数学问题。
	
	其次，把任何数学问题转化为代数问题。
	
	最后，把任何代数问题归结为解方程式。
	
	显然，这种“万能方法”是有漏洞的，在某些情况下是不适用的。笛卡尔未能完成他的“法则”，然而，他的想法却有某些深刻道理，仍不失为“一个伟大设计”。即使失败了，它对数学方法论的发展影响依然是不可抹杀的。虽然笛卡尔“万能方法”不能用于所有情况，但仍能适用于非常多的情况，其中包括一些十分重要的情况。用“列方程”的方法解应用题时，正是按照笛卡尔基本思想去做的。列方程就是建立数学模型。
	
	现代数学模型方法正是笛卡尔“万能代数模型”方案的继续延伸和直接推广，其框图为图\ref{fig:p33}。
	
	可以看出，制作数学模型，离不开数学符号。正如数学家M·黎伯特所说：“数学作为创造性学科，按三个基本步骤进行：
	
	（1）体验一个问题，从中发现一个模式；
	
	（2）定义一个符号系统表达这个模式；
	
	（3）把这个符号系统组织为一个系统的语言。”
	
	广义来讲，数学中各种基本概念（如实数、向量、集合、群、环、域、范畴、线性空间、拓扑空间…）以及各种方程式（代数方程、函数方程、微分方程、差分方程、积分方程）等都可以称作数学模型。因为他们都是以各自相应的现实原型作为背景而加以抽象出来的数学对象。
	
	狭义来讲，只有那些反映特定问题或具体事物系统的数学关系才叫做数学模型。在应用数学中，构造数学模型的目的都是为了解决具体实际问题。
	
	17世纪时，数学家、物理学家牛顿研究行星绕太阳运动问题的规律（太阳和行星二体问题），就是运用数学模型方法。他忽略研究目标天体外的其他各个天体的影响，把太阳与行星看成质量集中在中心理想质点，从而根据万有引力定律得出行星绕太阳运动的微分方程。通过微分方程解，推导出开普勒行星运动三大定律。即：
	
	\begin{figure}
		\centering
		% Requires \usepackage{graphicx}
		\includegraphics[scale=0.7]{cahtu1.png}
		\caption{示意图}
		\label{fig:p33}
	\end{figure}
	
	科学理论数学化已经成为现代科学发展的一个基本特点，而科学理论数学化关键在于建立适当的数学模型。例如，在生物学中，可以用微分方程模型（$dN=kNdt$）简单描述细胞增殖和人类数量增长。可以利用伯努利二项式分布模型（$P\{X=k\}=C^k_n p^k q^{\pi-k}$）描述生物群落在某个区域内分布情况，可以用线性代数网络模型来描述生物神经系统中信号传递等等。使得对生物现象的研究提高到精确可靠定量分析的水平。有人说，借助数学模型显示生物现象变化规律的方法，使生物学获得突飞猛进的第二次生命。
	
	现代数学模型已经非常广泛的应用于自然科学、工程技术、经济科学、军事科学、交通运输等科研与生活领域。在各种应用中，作为数学模型的“数学关系结构”都应该借助于数学概念和符号刻画出来的某种结构。
	
	\subsection{表达数学思维模式}
	数学符号可以表达数学思维模式。
	
	数学思维是人脑对数学信息进行加工的相对稳定的思维样式。数学思维模式与数学模型既有区别又有联系，它是由一定的数学知识结构和数学思维方式结合形成的动态系统。
	
	怀特海曾说过：“数学是对模型的研究”，整个数学实质上由各种层次大小不等的各种模型组成的模型系统。而数学思维模式是识别数学知识模型的有效途径和形式化、标准化的思维程序。因此数学思维模式有简约思维过程，降低思维强度，提高思维效率的认识功能。
	
	数学思想、观点是数学知识内容和数学思维规律的高度概括，适用范围较广，因而是较高或一般的数学思维模式，例如：交轨模式、方程模式、递归模式、叠加模式、逼近模式和映射模式等等。数学基本原理以及某些典型数学问题的解法是数学思维过程中的思维反应块，相当于房屋组合构件中的一些构件，它们适用于某一类特定问题的化归，因而是一些较低层次的具体的数学思维模式。例如，勾股定理，韦达定理等都是具体的数学思维模式。
	
	为了形成那些具体的数学思维模式，数学符号往往是不可缺少的。
	
	众所周知，整数加法和乘法服从5个基本运算规律--加法和乘法交换、结合率和乘法关于加法的分配律。这些运算规律是人类千万次运算经验的总结，为表达类似的普遍规律，不能使用诸如1、2、3这类表示特定数目的符号，这时，可以用变元作为表示整数的符号，于是，5个基本算术运算定律可以叙述为：
	\begin{align*}
	a+b &=b+a \\
	a\times b &=b\times a \\
	a+(b+c) &=(a+b)+c \\
	a\times(b\times c) &=(a\times b)\times c=a(bc)=(ab)c  \\
	a\times(b+c) &=a\times b+a\times c=ab+ac.
	\end{align*}
	这组公式堪称算术、代数乃至整个数学的基础。它借助于变元，把人们的运算经验表示为“相对稳定的思维模式”。正如日本学者池上嘉彦说：“符号能使一般性的理解方法固定下来”。人类使用符号表达数学思维模式，“肯定和维护已经诞生的人类文化秩序，使其功能化”。
	
	关于极限的定义是另一个典型例子。极限思维可以追溯到古希腊时期，直到牛顿时代，还未建立起严格定义。直到牛顿时期极限概念还是直观性的语言描述（以数列为例）。
	
	对于数列$a_n$，如果$n$无限增加时，$a_n$无限接近常数$A$，那么就说数列$a_n$以$A$为极限。
	
	这种描述性语言，人们很容易理解，但没有定量给出两个“无限”相互间的联系，不能作为科学论证的逻辑基础。当时正是由于缺少极限的严格定义，微积分理论才在当时受到人们怀疑和攻击。如瞬时速度这个概念，究竟$\delta t$是否等于0？牛顿自己也左右为难，无法解释。众所周知，这个微积分基础理论有问题。后来是柯西和维尔特拉斯建立严格极限定义才解决这个基本问题。
	
	设$a_n$是一个数列，$A$是一个常数，如果对任何$\epsilon >0$，总存在自然数$N$，使得当$n>N$时，不等式$|a_n-A|<\epsilon$恒成立，则$a_n$极限是$A$。	
	
	这个定义借助不等式符号，通过变元$\epsilon$和$N$的关系，定量和具体地刻画出两个无限过程的联系。因此，这个定义是严格的，可以作为科学论证基础，至今还在使用，尚不觉得陈旧。
	
	符号语言不仅给出数列极限的严格定义，且给出证明数列极限思维模式--一种“形式化、标准化思维程序”：要证明$\lim_{n\to \infty}a_n=A$，只要先给出一个任意一个小正数$\epsilon$，设法求出相对应的“$N$”，使得$n>N$时，$\mid a_n-A\mid<\epsilon $恒成立。
	
	可见数学符号具有表达数学思维模式的载体功能，正如池上嘉彦所说：符号的组合“能够规定思考方式”。
	\section{符号暗示信息}
	符号具有意指作用，因此，能暗示信息。信号弹上天，暗示行动开始，绿灯亮起，暗示车辆行人可以前进。数学符号暗示信息更多，可信度更高。
	
	数学规律，字母符号或表达式结构、特征等都含有自身思想内容，能暗示某种信息。对这种信息捕捉能力是科研工作者需要的。一个富有直觉洞察力的数学家，对这种信息的反应是很敏感的。	
	
	数学特别是数论好多重要定理都是从发现某种数学规律开始的。正如欧拉所说：“今天人们所知道的数的性质，几乎都是由观察者所发现的，且早在用严格论证确定其真实性前就被发现了。甚至到现在还有很多关于数的性质是我们熟悉但还不能证明的，只有观察者才能使我们知道这些性质。”这里，观察者的作用就是发现数字之间的各种规律。
	
	欧拉在一篇简短笔记中指出，对于正值参数$n$，级数
	%\[1-\frac{x^2}{n(n+1)}+\frac{x^4}{n(n+1)(n+2)(n+3)}-\frac{x^6}{n(n+1)\cdots(n+5)}+\cdots\]
	\begin{equation}\label{equ:eq4}
	1-\frac{x^2}{n(n+1)}+\frac{x^4}{n(n+1)(n+2)(n+3)}-\frac{x^6}{n(n+1)\cdots(n+5)}+\cdots
	\end{equation}
	对所有$x$值收敛。并提出一个惊人猜想：
	
	由公式\ref{equ:eq4}所定义函数当$0<n\leqslant3$时仅有实零点，并且有无穷多个。当$n>3$时，无实零点。这里$n$是连续变动参数。
	
	欧拉已经考察关于$n=1,2,3,4$，级数\ref{equ:eq4}和及其零点。
	
	\begin{center}
		\begin{tabular}{c|c|c}
			\hline
			% after \\: \hline or \cline{col1-col2} \cline{col3-col4} ...
			\qquad  n \qquad \qquad &  和 & 零点 \\ \hline
			1 &$ \cos x$ & $\qquad \pm \dfrac{\pi}{2}$,$ \pm \dfrac{3\pi}{2}$,$\pm \dfrac{5\pi}{2}$,$\cdots$ \qquad \\
			2 & $\dfrac{\sin x}{x}$ &\qquad $\pm\pi$, $ \pm2\pi$, $\pm3\pi$,$\cdots$ \qquad \\
			3 & $\dfrac{2(1-\cos x)}{x^2}$ &\qquad  $\pm2\pi$, $\pm4\pi$, $\pm6\pi$,$\cdots$ \qquad \\
			4 & $\dfrac{6(x-\sin x)}{x^3}$ & \qquad 无实数点 \qquad \\
			\hline
		\end{tabular}
	\end{center}
	欧拉通过观察出一个差异，在前三个实例中所有零点都是实的，在最后一个实例中无实零点。欧拉同时注意到前二个和第三个实例存在差异，对于$n=1$与$n=2$，两个相邻零点距离是$\pi$（$n=2$时相邻与原点零点除外），但$n=3$时，相邻零点距离是$2\pi$（相邻与原点零点除外），欧拉又进行进一步观察，发现$n=3$时所有零点均是二重零点。这是具有暗示性的结果。欧拉说，然而我们由分析得知”一个方程两根总是在虚根和实根的过渡中结合，那么，我们可以弄懂为什么$n>3$时，所有零点突然成为复的。“这些观察数据，对欧拉有暗示作用，他从中发现级数\ref{equ:eq4}累加和函数在$0<n\leqslant3$时仅有实零点，且有无穷多个，但是当$n>3$时，没有实零点。
	
	在欧拉时代，超越方程零点实性问题完全是新问题，甚至在今天还尚未具备系统方法解决类似问题。事实上，直到今天（2016年7月15日）尚未证实黎曼著名假设真假问题。因此，欧拉猜想是极其大胆与令人惊叹的。欧拉从几个零点数据的特征去猜测整体的，表现出超人的直觉洞察力。读者也许会问，为什么欧拉只考虑$n=1,2,3,4$几个实例就能进行猜测。这是因为欧拉抓住有力的旁证材料，获得了关键性息。
	
	举例来说吧。大家熟知，有二次方程$$x^2-k=0.$$
	
	当$k>0$时，方程有两根实根，当$k=0$时方程有二重根，当$k<0$时方程有两个虚根。也就是说，”方程两个根总是在由实根和虚根的过渡中相结合“。也许欧拉的记忆中也有类似潜知。为此，欧拉根据$n=1,2,3,4$时的观察资料，就有足够理由推测：级数\ref{equ:eq4}和函数当$0<n\leqslant3$时仅有实零点；当$n>3$时，方程没有实零点。这里$n=3$时的实例是欧拉作出猜想最强有力的、最有启发性的旁证材料。
	
	欧拉并未证实猜想的正确性，只是对一些特殊数$n$值（如$n=\dfrac{1}{2},\dfrac{1}{3},\dfrac{1}{4}$），进行过验证，经过多次核验，他相信公式的正确性。
	
	时隔150年，G·波里亚证实欧拉的这个猜想。详见波里亚的论文《关于欧拉论文的超越方程》。
	
	符号的暗示作用对于数学解题也是可贵的。数学解题中，正确思路的选择是头等重要的。正如波里亚所说：“解题的成功要靠正确思路的选择，要靠可以从可以接近它的地方去攻击堡垒“。像公路旁指示标志可以指示方向一样，数学符号能够暗示解题思路。
	
	运算符号蕴含相应运算的基本性质，它所暗示的解题思路对于数学解题是头等重要的。
	
	{\heiti 例}\quad 已知$y=3x^2+\sqrt{\arcsin x-\dfrac{\pi}{2}}+x-2$，求$\log_4y$值。
	
	如果不假思索，直接对方程进行运算，将很难取得满意结果。为顺利解题，需要选择正确思路。仔细观察题目，我们可以发现算术根符号，符号是意愿的标志，可以传播出一定的意义，这个根号符号向我们暗示一个信息--被开方数大于或等于0，暗示题目隐含条件：$\arcsin x-\dfrac{\pi}{2}\geqslant0$。同时考虑反正弦函数值域：$\mid \arcsin x\mid\leqslant\dfrac{\pi}{2}$，本题也就不难解答了。
	
	对数运算符号所传播的信息量更多。
	
	{\heiti 例}\quad 求解关于$x$方程
	\[
	\log_{\mbox{$cx+\dfrac{d}{x}$}}x=-1. \quad(c,d,x\in R,c\neq 0)
	\]
	对数符号将向我们传递出以下信息：$x>0,cx+\dfrac{d}{x}>0,cx+\dfrac{d}{x}\neq1$。
	
	再考虑等号，可以列出下列方程：
	\begin{equation*}
	\begin{cases}
	x>0\\
	cx+\dfrac{d}{x}>0\\
	cx+\dfrac{d}{x}\neq1\\
	x(cx+\dfrac{d}{x})=1
	\end{cases}
	\end{equation*}
	考虑到2式已经包含在1式中，公式4和公式3与$x\neq1$等价，上述方程可以简化为
	\begin{equation*}
	\begin{cases}
	x>0\\
	x\neq1\\
	x(cx+\dfrac{d}{x})=1
	\end{cases}
	\end{equation*}
	求解可得
	\begin{equation*}
	\begin{cases}
	x=\sqrt{\dfrac{1-d}{c}}\\
	\dfrac{1-d}{c}>0\\
	\dfrac{1-d}{c}\neq1
	\end{cases}
	\end{equation*}
	于是，当$\dfrac{1-d}{c}>0$且$\dfrac{1-d}{c}\neq1$时，方程有唯一解。
	
	数学符号的规律也能够暗示解题思路。
	
	\[x=\dfrac{1-d}{c}.\]
	当$\dfrac{1-d}{c}\geqslant0$或$\dfrac{1-d}{c}=1$时，方程无解。
	
	{\heiti 例}\quad 设点$P$是$\Delta ABC$外任意一点，且$PA=3,PB=4,PC=5$。求$\Delta ABC$边长。
	
	\begin{figure}[!h]
		\centering
		\includegraphics[scale=0.8]{p2}
		\caption{例子}
		\label{fig:p2}
	\end{figure}
	
	{\heiti 分析}\quad 由于$PA,PB$是已知条件，欲求$AB$值，可以在$\Delta PBA$中运用余弦函数，因此，需要先求$\angle APB$。题目中数字3，4，5，暗示我们一个信息：图形中含有直角三角形或者可以构造直角三角形，当然，构造直角三角形，必须对求解$\angle APB$有利。为此，需要变更线段$PC$与$PB$位置，和线段$PB$组成直角三角形。考虑到$\Delta ABC$是等边三角形，以点$A$为旋转中心，将$\Delta APC$逆时针旋转60$^{\circ}$，则顶点$P$到达点$M$位置，点$C$到达点$B$位置，$PC$到达$MB$位置，详见图\ref{fig:p2}。
	
	因为$\Delta PAC$和$\Delta MAB$是全等三角形。可得$PA=MA,\angle PAM=60^{\circ}$。又因为$\angle MPA=60^{\circ},\mbox{且}PM=PA=3$，可得$\Delta MPB$是直角三角形。所以$\angle APB=30^{\circ}$。
	
	难点得以解决。
	
	数学题题设条件中，字母符号所呈现的各种特征，都暗示着解题思路。特别地，在题设条件里地位相同的未知量暗示着我们它们在解题中地位也是相同的。根据这个原理，在很多时候能够使我们预测到问题解，或者发现解题途径。当然，其理由是不充足的，人们把类似原理称为”不充足理由律“。
	
	下文我们会给出一个例子加以说明。
	
	{\heiti 例}\quad $a$、$b$、$c$满足$a+b+c=1$，求证
	\[
	(a+\frac{1}{a})^2+(b+\frac{1}{b})^2+(c+\frac{1}{c})^2=\frac{100}{3}.
	\]
	
	{\heiti 分析}\quad 题目条件与结论中，$a$、$b$、$c$“地位”是平等的，根据不充足理由律，我们可以预测当左边各项等于$\dfrac{100}{9}$，即$a=b=c=\dfrac{1}{3}$时等号成立。依次猜测先将所需结论转化，再进一步探索证明途径。
	
	$\because$\quad $(a+\dfrac{1}{a})^2+(b+\dfrac{1}{b})^2+(c+\dfrac{1}{c})^2=(a^2+b^2+c^2)+(\dfrac{1}{a^2}+\dfrac{1}{b^2}+\dfrac{1}{c^2})+6.$
	
	令$A=a^2+b^2+c^2$，$B=\dfrac{1}{a^2}+\dfrac{1}{b^2}+\dfrac{1}{c^2}$，当$a=b=c=\dfrac{1}{3}$时，$A=\dfrac{1}{3}$，B=27，而$\dfrac{1}{3}+27+6=\dfrac{100}{3}$。
	
	因此，把上面两个公式相比我已看出：要证明原式只需要证明$A\leqslant\dfrac{1}{3},B\leqslant27$。
	
	先证明$A\leqslant\dfrac{1}{3}$，即$3A\leqslant1$。
	
	根据已知条件先证明$3(a^2+b^2+c^2)\leqslant(a+b+c)^2$，由$2(a^2+b^2+c^2)\leqslant2(ab+bc+ac)$分别加$a^2+b^2+c^2$得到。
	
	再证$B\leqslant27$。
	
	由$a+b+c\leqslant3\sqrt[3]{abc}>0$。
	
	得$abc\geqslant\dfrac{1}{27}$，$\dfrac{1}{abc}\leqslant27$。
	
	故得$B\geqslant\sqrt[3]{27^2}=27$。
	
	“不充足理由律”特别适用于对称性，数据和条件对称性往往在解中得到反映。某种程度上，“数据和条件对称性”不仅仅被“求解对象”所反映，且为“求解过程”所反映。人们把这种原理叫做对称性原理。
	
	{\heiti 例}\quad 已知四面体$P-ABC$六条棱长和为$l$，并且$\angle APB=\angle BPC=\angle CPA=90^{\circ}$，求四面体最大体积（美国第五届中学数学奥林匹克竞赛试题）。
	
	{\heiti 解}\quad 设$PA=a$，$PB=b$，$PC=c$。
	
	则$AB=\sqrt{a^2+b^2}$，$BC=\sqrt{b^2+c^2}$，$CA=\sqrt{c^2+a^2}$。
	
	根据题意，有
	\[
	l=a+b+c+\sqrt{a^2+b^2}+\sqrt{b^2+c^2}+\sqrt{a^2+c^2}.
	\]
	\[
	V=\frac{1}{6}abc.
	\]
	不难看出以上两式都是$a$、$b$、$c$轮换对称式。这种对称性使得$a$、$b$、$c$在求体积最大这个问题中所取作用是相同的。根据不充足理由律，我们可以根据预测，当$a=b=c$时，四面体体积最大。
	
	我们由上式先求得$a=b=c$时四面体体积。这时
	\[
	a=b=c=\frac{l}{3(1+\sqrt{2})}.
	\]
	\[
	V=\frac{1}{6}(\frac{l}{1+\sqrt{2}})^3.
	\]
	需要证明
	\[
	\frac{1}{6}\leqslant\frac{1}{6}(\frac{l}{1+\sqrt{2}})^3
	\]
	正确性就可以证实上文猜想。
	
	要证
	\[
	\frac{1}{6}\leqslant\frac{1}{6}(\frac{l}{1+\sqrt{2}})^3
	\]
	只要证
	\[
	(1+\sqrt{2})\sqrt[3]{abc}\leqslant\frac{1}{3}(a+b+c+\sqrt{a^2+b^2}+\sqrt{b^2+c^2}+\sqrt{c^2+a^2}).
	\]
	由于$\sqrt[3]{abc}\leqslant\dfrac{1}{3}(a+b+c)$，因而只要证明
	
	$\sqrt{2}\sqrt[3]{abc}\leqslant(\sqrt{a^2+b^2}+\sqrt{b^2+c^2}+\sqrt{a^2+c^2})$上式的确是成立的。这是因为
	\begin{align*}
	\frac{1}{3}\sqrt{(a^2+b^2)}+\sqrt{(b^2+c^2)}+\sqrt{(c^2+a^2)}\leqslant \\
	\sqrt[6]{\sqrt{a^2+b^2}\sqrt{b^2+c^2}\sqrt{a^2+c^2}}\leqslant\sqrt[6]{8a^3b^3c^3}=\sqrt{2}\sqrt[3]{abc}.
	\end{align*}
	
	现代，对称性原理已经渗透到自然科学很多领域。杨振宁曾说过：“三十多年以来，我进行物理研究工作，都同时对对称性原理和统计物理两大题目有关”。1979年，他在关于纪念爱因斯坦诞辰100周年纪念会上的一个演讲主题是“对称性决定相互作用”。
	
	人们评价说，对称性原理“支配着理论物理学家创造数学表达形式，使我们懂得应该怎么创立理论，才能精确地描述自然界。”
	\section{约简思维，促进思维“机械化”}
	数学家怀海特曾说过：“一个良好的标记法，可以使头脑摆脱不必要的工作负担和约束，使它集中于先进的问题，这就在事实上增加了人类头脑的能力。”在数学中，问题的陈述、推理的过程以及定量计算，都运用了简明的数学符号，大大简化和加速思维的进程，促进思维“机械化”，思维的经济原则则在数学中得到高度发挥。正如数学家马赫所说：“数学的力量在于避免了一切不必要的思想而采取了最为经济的思维方式。序号被称为数，这就已经形成了一种奇妙、简单又经济的系统。当我们进行数乘法运算时，利用乘法表就使我们得以以利用先前已完成的结果，而不必每一次都去做重复运算。再例如，当我们利用行列式去解方程组时，以及当我们把新积分表达式分解为其他已知表达式时，我们就可以看到拉格朗日或柯西的智力活动，他们总是以军事司令官的敏锐识别力，统帅着所有已完成运算的‘军队’，并由此去执行新运算任务。”有些数学家还把数学说成是“极端思维经济学”。
	\subsection{使用符号可以约简推理过程}
	数学离不开推理。怀特海曾说：“广义来讲，数学是乃是多种必然演绎推理的展开”。数学被称为演绎的科学，它的每一个学科都是从最少的几个原始概念和几条公理出发，经过推理获得整个学科的全部知识。例如，通常几何是仅从5条公理（欧几里得公理）出发推导出来的，数论是从5条公理（皮亚诺公理）出发推导出来，如此等等，不胜枚举。罗素和怀特海在《数学的原理》一书中还说：“纯粹数学是所有形如‘$p$蕴含$q$’的所有命题类”。其实，这种说法虽然片面，只却反映了数学的一个侧面：”已经严格提出来的数学是一门系统的演绎科学“。然而，“正在形成的数学是一门实验性的归纳科学。”数学中还经常运用归纳推理、类比推理等思维形式。
	
	符号与推理有密切关系。古代，斯多葛派哲学家提出符号问题，是为了建立严格的三段论逻辑的需要。他们认为，符号间的关系就像三段论向外部物质的投影。数学符号对于数学推理“看来是必不可少的”。使用合适的符号系统可以使数学推理步骤变得简单，达到以最少思维获得最佳效果的效能。
	
	波里亚曾说：“对于数学符号的重要性我们几乎总是不会估计过高的。现在使用十进制符号的计算工作者比古代不能用以如此方便的形式计数的计算工作者要沾光的很多。“所谓沾光，就是简约思维。拉普拉斯曾盛赞阿拉伯数字符号：“用不多的记号表示全部的数的思想，赋予它除形式的意义外，还有位置上的意义，它之所以如此绝妙，正是由于这种简易（思维的方便）难以估量。”阿基米德是一个伟大的数学家，高斯很敬佩他，可高斯对阿基米德未能发明十进制以及其表示方法感到遗憾，高斯说：”令人不解的是，他怎么没有看出这一点，假如阿基米德能做出这个发现的话，那么现在的科学该处在多么高的水平上呀“。由此可见，高斯对十进制符号的思维功能有极高的评价。
	
	古代，关于一元二次方程求解讨论方法大概要写200页，而现在大概只要1页纸就够了，这正是因为借助于现代代数符号系统。当初，正是笛卡尔看到符号代数具有简约思维、加速进程的效果，才着手把代数应用于几何的伟大工作。后来，解析集合的发展果真达到笛卡尔的目标。不妨，请看实例
	
	图\ref{hudie}
	\begin{figure}
		\centering
		\includegraphics[scale=0.67]{Proof_of_Butterfly_theorem.png}
		\caption{\mbox{蝴蝶定律}}\label{hudie}
	\end{figure}
	设点$M$是圆内弦$PQ$中点，过$M$作弦$AB$和$CD$。设$AD$和$BC$各相交$PQ$于点$X$和$Y$，则$M$是$XY$中点。求证$QM=PM$。
	
	蝴蝶定理（Butterfly theorem），是古典欧氏几何最精彩的结果之一。蝴蝶定理最先是作为一个征求证明的问题，这个命题最早出现在1815年，而“蝴蝶定理”这个名称最早出现在《美国数学月刊》1944年2月号，题目的几何图形象一只蝴蝶，便以此命名。这个定理的证法多得不胜枚举，证明方法很多，长短难度各不相同，至今仍然被数学热爱者所研究，在考试中时有出现各种变形题目。下面请看一种证明方法。
	
	以$M$为原点，以$AB$为$x$轴建立直角坐标系，寻找一个二次方程，一次项系数为0，点$P$和$Q$横坐标满足方程。
	
	设圆方程为$x^2+(y+a)^2=r^2$。直线$CD$和$EF$方程分别为$y=k_1x$和$y=k_2x$。
	
	圆和两条直线组成二次曲线系为
	\[
	\mu[x^2+(y+a)^2-r^2]+\lambda[(y-k_1x)(y-k_2x)]=0.
	\]
	令$y=0$，则
	\[
	(\mu+\lambda k_1k_2)x^2+\mu(a^2-r^2)=0.
	\]
	因为一次项系数为0，所以两根$x_1$和$x_2$和为0,，所以$QM=PM$。
	
	证明方法很巧妙，这是一个杰出的证明。如果用一个运用综合法几何的证明相比较，就足以看出该证明方法的确可以节省推理步骤。
	
	关于微积分符号，有人提出，“莱布尼茨发明微积分，还有一个特别巧妙的微积分符号体系“。当然，应当说是他发明了两者。事实上，他的微分和积分符号抓住了微积分本质，使符号和概念成为一个不可分割的整体。正如人们所说：莱布尼茨的符号表示法可以作为一种”看得见、摸得着的媒介，以便用来指导思维”，一个突出例子是微积分基本公式
	\[
	\int_{a}^{b}f(x)\mathrm{d}x=F(b)-F(a).
	\]
	其中$f(x)$连续函数位于区间$[a,b]$。$F(x)$是$f(x)$原函数。
	
	这个公式以极其简洁的符号，揭示了定积分和不定积分两个不同概念的内在联系。本来，人们计算定积分，需要计算积分和极限，对于不同积分需要寻找不同途径，大多很艰难。这个困难，使得微积分方法迟迟不能得到广泛推广。自从莱布尼茨和牛顿建立这个公式以后，人们得到一个求解定积分的一般方法，很大程度程度上简约思维，加速思维进程。正如莱布尼茨所说：符号方法可能“对推理增加的威力大大超过光学仪器对视力的辅助作用”。
	
	\subsection{符号推演代替思维演替}
	我们提出，莱布尼茨首先提出仿照数学符号方式，为人类思维建立一套普遍适用的符号体系，也就是说要创造一个“万能算法”。他认为，数学由于有一套独特的符号系统，因而能够有效的表达思维和进行推理。如果人类思维中的概念、判断和推理等可以用合适的符号来表示，我们就可以借助于这套符号来进行思维的运算，用计算代替思考。“有了这种东西，我们对形而上学和道德问题就可以像几何学和数学分析一样进行推论”。“两个哲学家也不需要辩论，只要拿起石笔，在石板前坐下来，彼此说一声，我们来算算，也就可以了”。尽管莱布尼茨未能完成该计划，但他的工作对后世有很大积极影响。现代，数理逻辑中，概念、判断、推理和证明全部可以用符号和式子给与表示。例如，古典逻辑中矛盾律、排中律和传递率分别表示如下：
	
	矛盾率：$p\land \textasciitilde p\equiv 0$；
	
	排中律：$p\lor p\equiv1$；
	
	传递律：$(p\to q)\land (q\to r)\to (p\to r).$
	
	
	在数理逻辑中已经把推理和证明过程符号化、形式化。从一些简单明了的公理出发，使得一些简单甚至机械推理规则和步骤，便可以解决日常生活或科学研究中的逻辑推理问题。
	
	{\heiti 例}\quad 甲、乙、丙、丁四人同时参加一次数学竞赛，四人预测名次谈话如下：
	
	甲：丙第一名，我第三名。
	
	乙：我第一名，丁第四名。
	
	丙：丁第二名，我第三名。
	
	丁没有说话。
	
	公布结果时发现他们所说一半正确，请你说出本次竞赛四人排名情况（假设不存在并列排名）。
	
	{\heiti 解}\quad 假设“甲第一”记作$A_1$，“甲第二”记作$A_2$…，乙第一记作$B_1$……以此类推。则甲说$C_1A_3$，乙说$B_1D_4$,丙说$D_2C_3$，因为他们预测只正确一半，因此
	\[
	(\overline{C_1}A_3)+(\overline{A_3}C_1)=1.
	\]
	\[
	(\overline{B_1}D_4)+(\overline{D_4}B_1)=1.
	\]
	\[
	(\overline{D_2}C_3)+(\overline{C_3}D_2)=1.
	\]
	故
	\[
	(\overline{C_1}A_3+C_1\overline{A_3})(B_1\overline{D_4}+\overline{B_1}D_4)(\overline{D_2}C_3+\overline{C_3}D_2)=1.
	\]
	展开左式，综合分析可知8个式子只含有一个真命题$A_3B_1\overline{D_4}D_2C_3$，值为1，所以乙第一，丁第二，甲第三，丙第四。
	\subsection{符号化促进思维“机械化”}
	用一个固定程序解决一些问题，是数学机械化基本思想。追求数学机械化方法，是我国古代数学优秀传统之一。我国古代数学研究中心问题是问题求解，把问题分成若干类，分别研究解决方法（一系列确定步骤），会一个方法，就能解决一类问题。《九章算术》就有类似特点。韦达引入代数符号体系后，代数中心问题--解方程问题就出现固定程式，或说产生机械法则。对于其他数学问题，特别是几何问题，能不能建立一套机械化求解法则呢？
	
	我们知道，笛卡尔首先觉察到符号代数具有一种使思维“机械化”的可能性。他试图建立“万能代数模型"，就是想对一切实际问建立一套机械化的求解步骤，因为“一切实际问题化为数学问题，一切数学问题化为代数问题，一切代数问题化为代数方程求解问题。”而代数方程求解是有机械法则的。
	
	尽管笛卡尔没有完全实现他的计划，但是，他创立了解析几何方法，把可以初等几何问题转化为代数问题。
	
	莱布尼茨设想的“万能算法”也是试图实现推理的“机械 化”，他曾有过“推理机器”的设想，希望用一台机器代替人的推理活动。菜布尼茨在1671年设计过一台能乘能加的计算机。他说：“像奴隶似的把大量时间花费在计算上，对于聪明的人来说，是很不值得的，因为完全可以把这样的工作委托给其他任何人使用机器去进行。”他竭力寻找《万能算法》就是试图使数值计算乃至人的一切合理的思维过程标准化、“机械化”，从而减轻例行的重复性的脑力劳动。
	
	现代电子计算机原型当推1936年英国数学家图灵设计的一台计算机，即所谓图灵机。图灵成功的关键就在于对数值计算进行数学抽象和逻辑分析，把思维的推演过程“机械化”。
	
	图灵发现，在数值计算时，计算者是谁，用的什么样的纸和笔等等都是非本质的、无关紧要的。计算过程中实质的东西就是一些符号记在某种器具上，计算的行为随着作为各种结果的各种特定符号而变化。图灵的工作主要是把人们在进行计算时的动作分解为比较简单的动作，我们想象一个人在一张方格纸上做计算，他需要(1)—种贮存计算结果的贮存器，即纸张。 (2)—种语言，表示加减乘除等操作和数字的符号。(3)扫描区，在计算过程中看到的上下左右几个方格的数字。（4)计算意向，即在计算的毎一阶段打算下一步做什么，例如看到6+9就要准备进位等。（5)执行下一步的计算。至于每一步计算，无非是(1)改变数字或符号,（2)扫瞄区的改变，往左进位或往右添位等，(3)计箅意向改变等。
	
	另外，图灵还把计算过程转化到一条线性的纸带上进行。例如，$26\times32$的竖式演算，可以改写成$26\times32 = 52 + 780 = 832$。如果每个数字都用二进位数码表示，$+,-,\times,\div,=$等运算符号也用二进位数码表示，那么一个计算无非就得到一条纸带上的一串0和1组成的数串，计算过程就可看作是相继选取符号“ 0 "或“1 ”的机械动作。
	
	图灵正是根据以上原理设计出图灵机。图灵机可以照人们指定的算法程序进行计算，从而使计算活动机械化、自动化。
	
	以希尔伯特为首的形式主义学派设想把数学化为关于有限符号排列的操作。他们主张使用符号推演代替语言，而符号的使用要靠约定的规则。
	
	按照他们的设想，首先要有一个符号表，其中只有有限个符号，这些符号是准备用来代替我们日常讨论数学问题的语言的。
	
	就像用字组成句子一样，符号可以组成所谓的公式。有些公式可能没什么意义，有些公式可能有意义。有意义的公式叫“合式公式”。当然，“合式公式”是用具体的规则来说明的。“合式公式”相当于命题。从“合式公式”中选择--些基本的公式，相当于公理。为了从”公理“推演出别的”公式“ (定理），应该有一些推理规则。这些规则也是明确规定的, 即什么符号串可以换成什么样的符号串。
	
	为此，数学推理就变成完全确定规则的机械化的符号操作了。
	
	对这套符号系统的研究，叫元数学或证明论。
	
	希尔伯特建立了元数学--形式系统数学后，进一步考虑过两个问题：
	
	(1)	既然数学命题可以用形式系统”合式公式“来表示。那么，应用形式的推演规则，能不能推出所有的真命题呢？如果能推出所有的真命题，就说这个系统是完全的。（{\fangsong ZFS公理系统}）
	
	(2)	形式系统会不会推导出矛盾呢？会不会既能推出某命题，又能推出某命题否命理呢？如果推不出矛盾，就说这个形式系统是协调的。希尔伯特试图证明形式数学系统的完全性与协调性。
	
	尽管希尔伯特这两个目标都不可能达到，但将数学形式化的基本思想已被大家广泛接受。
	
	形式化的语言可以直接用于计算机程序设计，它的毎一步骤都具有纯粹机械操作的性质。用形式化的语言写的教科书实际上是一串长长的符号链。它经过数学家或机器处理时，就变成另一个符号链。
	
	最近十几年来，巳经有人将符号逻辑的研究成果应用于电子计算机，初步实现了数学证明的机械化。我国数学家吴文俊在1977年率先发表了他的初等几何机器证明的方法。
	
	吴氏方法的基本要点是：先把几何问题化为代数问题，再把代数问题化为代数恒等式的检验问题。代数恒等式的检验是机械的，问题的转化过程也是机械的，整个问题也就机械化了。
	\section{刺激联想活动}
	联想是由一事物想到另一事物的心理过程。它是以观察为基础，根据研究对象的特点，结合已有的知识和经验进行想象的思维方法。联想在科学认识活动中起着挢梁作用，它使人们由此及彼、由表及里沟通知识间的联系。牛顿由苹果落地联想到行星运动；阿基米德由浴盆洗澡联想到王冠之谜。在解决问题时，联想得快表现为“点子多”、“反应快”、“头脑灵活”。
	
	符号作为一种可感的实体，是一种刺激，它能激发人们的联想的火花。一个符号形式不仅能剌激大脑，联想到相应符号内容，还能联想到更丰富的情景。毒药瓶上的骷髅头符号能使人联想起中毒、救命车、医院、太平间、火葬场……电视荧屏上暴风雨标志使人联想起大雨、大水、大灾、抗洪救灾……数学符号也不例外，由于数学符号的髙度抽象性，它激发的联想更是多方位的、多层次的，高度发散的。例如，符号“1”可算是笔划最少、最简单的一个符号，然而，它却能拨动心弦，令人产生多方面的联想。
	\begin{equation*}
	1\to\begin{cases}
	\mbox{单位圆半径}\\
	\sin^2\alpha+\cos^2\alpha=1\\
	\lg10=1\\
	\dfrac{x^2}{a^2}+\dfrac{y^2}{b^2}=1\\
	\lim_{x\to0}\dfrac{\sin x}{x}=1\\
	C^n_n=1\\
	(-\dfrac{1}{2}\pm\dfrac{\sqrt{3}}{2})^3=1
	\end{cases}
	\end{equation*}
	\begin{equation*}
	1=\begin{cases}
	\mbox{初始元}\\
	\mbox{单位元}\\
	\mbox{单位矩阵}\\
	\mbox{恒等变换}\\
	\mbox{全集}\\
	\mbox{接通}\\
	\mbox{真命题}\\
	\mbox{哥德巴赫猜想--1+1}\\
	\cdots
	\end{cases}
	\end{equation*}
	恩格斯曾对“1”这个单位数量结合初等数学内容作过很好的阐述。其实1在高等数学各个理论中均有特殊涵义，有重要作用，现代数学家很在意“1”这个基础概念，有数学家为给“1”下定义，甚至写下200多页纸，可见“1”具有丰富内涵，有些学者可以从“1”联想到几十到数百种数学表达式。
	
	由于数学符号的刺激，可以联想到相关的定义、公式、基本解题方法及邻近学科的知识。当然，联想的深度与广度，均与大脑这个储存器中的信息量有关，与思维品质的广阔性、深刻性和灵活性相联系。
	
	按照思维运演方向来看，由数学符号激发的联想可以大致分为纵向、横向和逆向三种。
	\subsection{纵向思维}
	数学符号能够刺激大脑，由眼前数学对象沿纵深方向联想到相关对象。比如，由数字符号联想到字母符号；由代表数字字母符号联想到代表抽象元素字母符号；由几个字母符号联想到多个字母符号；由简单字母符号组合到复杂字母符号组合……
	
	不管是在理论研究，还是在解决一般问题过程中，类似纵向联想都是不可缺少的。它引导人们逐步深化结论，发展成果。
	
	例如，如果$a$和$b$均是正数，且$a+b=1$，则
	$$(a+\dfrac{1}{a})(b+\dfrac{1}{b})\leqslant\dfrac{25}{4}=(2+\dfrac{1}{2})^2.$$
	这个不等式是不难证明的。
	
	本式含有两个变元，自然而然可以联想到三个正数$a,b,c$，对于三个正实数，如果存在$a+b+c=1$，是否会有不等式
	\[
	(a+\frac{1}{a})(b+\frac{1}{b})(c+\frac{1}{c})\leqslant(3+\frac{1}{3})^3
	\]
	成立？
	
	可以证明，答案是肯定的。于是可以联想到含有4个或5个甚至$n$个变元。事情和想象如出一辙。若$a_i>0(i=1,2,3,\cdot,n)$，且$\sum^n_{i=1}a_i=1$，则不等式
	\[
	\prod_{i=1}^N(a_i+\frac{1}{a_i})\leqslant(n+\frac{1}{n})^n.
	\]
	成立。
	
	这种深化和推广工作，似乎微不足道，不值一提。其实数学中不少重大发现都是发端于这种“微不足道”的联想。
	
	举世瞩目的哥德巴赫猜想是怎么引起的？观察下面几个等式：
	
	\begin{align*}
	3+7&=10 \\
	13+7&=20\\
	13+17&=30\\
	\end{align*}
	可以发现等式左边3，7，13，17都是奇质数，等式右边10，20，30都是偶数，上面几个等式中几个偶数都是两个奇质数和。哥德巴赫正是从“几个偶数”联想到“一切偶数”，根据归纳法推测“任何一个大于4偶数都是两个奇质数和”。也许哥德巴赫自己也未意识到，如此简单的联想竟然会发展为“数学皇冠上的明珠”。
	
	费马大定理也不是源于多么复杂的构想。
	
	我国早在商朝就知道不定方程$x^2+y^2=z^2$含有至少存在一组整数解：$x=3$，$y=4$，$z=5$。
	
	古希腊数学家丢番图求得一般解答:$x=2mn$，$y=m^2-n^2$，$z=m^2+n^2(m,n\in \mathbb{Z})$。
	
	如果指数$n>2$，$x^n+y^n=z^n$是否曾在正整数解？费马认为不存在，得到命题：
	
	当$n>2$时，$x^n+y^n=z^n$无正整数解。这就是著名的费马大定理。
	
	费马曾经钻研过丢番图著作。他在丢番图著作某页空白处写道：“将一个立方数分为两个立方数，一个四次幂分为两个四次幂，或者一般地将两个高于二次幂分解为两个同次幂，这是不可能的。关于此问题，我确信已发现一种美妙的证法，可惜这里空白太小，写不下。”费马正是由“二次幂”联想到“$n$次幂”。
	
	费马死后，人们发现这段文字，可是无论如何未能找到这个定理证明，于是激起很多数学家兴趣，试图给出证明，但均未成功。布鲁塞尔和巴黎科学院数次设立悬赏奖金，也未曾取得结果。三个多世纪过去，费马大定理尚未得到证明或推翻。
	\subsection{横向联想}
	数学符号能够刺激大脑进行横向联想。即由眼前数学对象联想到临近其他学科相关对象。例如有序实数对符号$(a,b)$可以使人产生如下联想：
	\begin{equation*}
	(a,b)\to\begin{cases}
	\mbox{复数}a+bi\\
	\mbox{点}Z(a,b)\\
	\mbox{向量}\overrightarrow{OZ}\\
	\mbox{力}\\
	\mbox{速度}\\
	\mbox{加速度}
	\end{cases}
	\end{equation*}
	
	这种横向联想在过去、现在和未来数学研究中都会有很大作用。正如H·弗赖登塔尔所说：“数学在发展过程中，不仅向前沿外扩张，各个分支互相穿过边界相互扩张。……几何问题用代数解，代数问题几何解。从计算机原理出发，再一小步就是宇宙原理和思维原理”。
	
	“虚数”怎么变得“不虚”？得益于横向联想。
	
	1545年，意大利数学家卡当第一次认真讨论虚数，在以后很长时间内，人们都对虚数抱以怀疑态度。卡当自己也认为，负数怎么能开平方？他称负数平方根为“诡辩量”。近100年后，笛卡尔给“诡辩量”取名“虚数”（和“实数对应”）。牛顿也不认为虚根是有意义的，很可能是他认为虚数“缺乏物理意义”。莱布尼茨虽然在形式运算中使用虚数，但未能理解虚数性质，因此把虚数看作“两栖怪物”。直到18世纪，欧拉还说虚数“只存在于幻想中”，他在论文《微分公式》中首次使用$i$表示$\sqrt{-1}$，但当时未能引起重视。1801年，高斯开始系统地使用虚数符号，以后才逐渐通行于全世界。
	
	“虚数不虚”思想是引入复平面后才为人们广为接受的。17世纪，英国数学家瓦里士已经意识到直线上没有虚数几何表示方法。1797年，挪威测量学家维塞尔向丹麦科学院递交论文《方向的解析表示，特别应用于平面和球面多边形的测定》。他首先提出把复数$a+bi$用坐标平面点$(a,b)$表示，使全体复数和平面点建立一一对应关系，形成复平面概念，可是当时未能受到关注。1806年，日内瓦人阿工在巴黎发表论文《虚量，它的几何解释》，也谈到复数几何表示法，用“模”表示向量$a+bi$长度，“模”这个术语来源于此。
	
	高斯在1799年已经知道复数几何表示，他在1799年、1815年和1816年对代数基本定律作出的三个证明中，都假设复数和直角坐标平面点一一对应。但直到1831年，他才对复平面作出详细说明，使人们接受复平面思想。后世一些科学家称复平面为高斯平面。
	
	利用复数几何表示法，复数还可以用坐标平面上向量表示。两个复数相加可以按照向量加法平行四边形法则来进行，复数和$i$（或$-i$）相乘相当于复数向量逆时针旋转$90^{\circ}$。使得物理学很多向量，例如力、加速度和速度等等都可以借助复数来进行计算，使复数成为包含物理等自然科学的重要工具。
	
	所谓“笛卡尔连接法”源于代数与几何横向联系。大家熟知，笛卡尔把符号代数应用于几何研究，建立解析几何，是17世纪重大发现，数学史上三大发明之一。
	
	狭义地讲，“笛卡尔连接”是几何图形与代数方程之间的结合。例如我们看到$\dfrac{x^2}{a^2}+\dfrac{y^2}{b^2}=1$，大脑中立刻联想到椭圆方程，如果$a=b$，则为圆方程。
	
	广义来讲，“笛卡尔连接”是指一切分析的、逻辑的、抽象概念与综合的、直观的、具体形象间的结合。
	\begin{center}
		\begin{tabular}{c|c}
			\hline
			% after \\: \hline or \cline{col1-col2} \cline{col3-col4} ...
			\qquad	\qquad 看到的\qquad \qquad&\qquad \qquad 联想的\qquad \qquad\\ \hline
			$S=ab(a,b>0)$&面积$S=$长$a\times$宽$b$\\
			$ax+by=c=0$&直线\\
			$\{a+n\}(n=1,2,\cdots,n)$&动点$a_n$\\
			$\lim_{x\to x_0}f(x)=f(x_0)$&曲线在$x_0$处连续\\
			$f(x)=0$存在两个根&曲线与$x$轴存在两个交点\\
			$f^{\prime}(x)>0(x<0)$&曲线上升\\
			$f^{\prime}(x)=0$&切线平行与$x$轴\\
			\hline
		\end{tabular}
	\end{center}
	
	如果说，在解析几何时代需要笛卡尔那样的连接，那么，在科学发展的当代，就更不能忽视这种方法了。科学的发展要求人们在更为广阔的意义上运用这种连接法，更充分地发挥抽象思维和形象思维的互补功能。
	
	1980年杨振宁博士曾在上海作过"爱因斯坦和20世纪下半期的物理学”的演讲，演讲的主题之一就是物理原理几何化。 他认为，麦克斯韦用数学方程式表示了法拉弟关于磁力线的几何想法，而爱因斯坦在许多文章中都讲到过物理原理几何化问题。爱因斯坦把电磁场看作空时结构，实际上是把它看成几何结构。杨振宁通过非常美妙的想法把引力看成是几何。引力是几何，那么，所有物理原理都可能是几何。应当承认，物理原理几何化从广义上来看也是一种笛卡尔连接。
	
	数学家谷超豪也在一次科学史讲演中谈到了几何学在物理学发展中的作用。他回溯了古希腊几何学家阿波罗内斯的圆锥曲线理论对开普勒发现行星运动三大定律、牛顿发现万有引力定律理论的影响，黎曼的弯曲空间几何理论对爱因斯坦建立广义相对沦所起的重要作用，表明了“笛卡尔连接法”的现实合理性。
	\subsection{逆向思维}
	数学符号能够刺激大脑逆向思维。
	
	数学中某些概念总是成对出现，例如：相等与不相等、对称与不对称、直线与曲线、有限与无限、运动与固定、相同与不同、收敛与发散等等。有些运算也是成对出现，例如：加法与减法、乘法与除法、乘方与开方、指数与对数、三角函数与反三角函数、微分与积分等等。每一对中都含有两个“对立方面”。所谓逆向联想是指由眼前数学对象联想到对立面数学对象。例如：
	
	\begin{center}
		\begin{tabular}{c|c}
			\hline
			\qquad \qquad 看到的 \qquad \qquad&\qquad \qquad 联想的\qquad \qquad \\ \hline
			$-$&加法\\
			$+$&乘法\\
			$\sqrt{\quad}$&乘方\\
			$\log$&指数\\
			$\arcsin$&正弦函数\\
			$\int$&微分\\
			\hline
		\end{tabular}
	\end{center}
	
	事实上作为逆运算的减法、除法、开方、反三角函数、对数函数和积分等相对于原数学对象的运算复杂一些，处理逆运算往往依赖于原运算。例如，小学生做除法练习，需要会使用乘法口诀，一见到除号能够联想到乘号。微积分运算也是如此，求导数需要用到导数四则运算和复合函数求导法则，而积分运算是以微分运算逆运算来定义的，并没有指出完成积分运算的步骤过程，这种“非构造性”特征，使得求原函数比求导数困难，求原函数需要逆向思维使用求导公式。可以说，看到”$\int$“符号必然联想到微分运算。
	
	这种逆向思想在数学研究中具有明显特殊作用，它是辩证思维方法的一个重要方面。我国古代数学家刘徽用割圆术推求圆周长时，就是”化曲为直”，用直线逼近圆。莱布尼茨为解决曲线切线问题引出导数概念，也是“化曲为直”，在小范围内用直线代替曲线。牛顿为解决非直线匀速运动瞬时速度问题引出导数问题，其方法是“化变化为不变”，在短时间内用匀速运动代替非匀速运动。
	
	无论是高等数学还说初等数学，都充满各种矛盾，充满对立和相互转化。恩格斯在数学札记中不仅指明这点，而且具体分析过一些矛盾，像一和多，直线和曲线等，他不但分析数学概念间辩证关系，且特别注意到数学运算间相互转化重要性。在“数学运算”这则札记中，他以四则运算和代数运算中经常出现的相互转化，例如加法和减法、乘法和除法、乘法和加法、除法和减法以及根和幂之间的相互转化为例，说明：“计算方法一切固定差别都消失了，一切都可以用相反形式表示出来”。并进一步指出：“这种从一个形式到另一个相反形式的转化，并不是一种无聊的游戏，而是数学最有力的杠杆之一”。
	\section{诱发数学灵感}
	语言本身就是科学发现的工具，数学语言是数学发现的工具。发现虚数就是一个典型例子。虚数最早出现在解二次方程过程中。1484年，法国人舒开在《算术三篇》中，解二次方程$4+x^2=3x$时，得根$x=\dfrac{3}{2}\pm\sqrt{2\dfrac{1}{2}-4}$，他声称根不可能存在。
	
	1545年，卡当在《大术》中有一个问题：两个数和是10，积是40，求这两个数。
	
	现代符号可以列方程
	\begin{align*}
	x(10-x)&=40\\
	x^2-10x+40&=0\\
	\end{align*}
	解得$x=5\pm\sqrt{-15}$。
	
	卡当还发现，某些三次方程实根可以用含负数平方根代数式表示，例如，方程
	\[x^3=15x+4\]
	三个根$x_1=4$，$x_{2,3}=-2\pm\sqrt{3}$可以统一表示为$x=\sqrt[3]{2+\sqrt{-121}}+\sqrt[3]{2-\sqrt{-121}}$。
	
	尽管他对负数开平方感到很奇怪。但他对这种奇怪的“诡辩量”进行过认真讨论，给出了运算方法。他说：“不管我的良心受到多大的责备，但是的的确确$5+\sqrt{-15}$和$5-\sqrt{15}$积刚好等于40”。
	
	人们公认为虚数是卡当引入的。虚数的引进“照亮整个世界”，给数学界带来根本性变革。
	
	怎样创造？怎样发现？爱因斯坦说：”直觉和灵感是头等重要的”。数学符号能够暗示信息，刺激联想活动，有助于诱发灵感。数学中很多重要发现都得益于灵感。
	\subsection{灵感及其特性}
	当代，灵感之谜，被誉为“创造学、思维学、心理学皇冠上的一颗明珠”。千百年来，人们对灵感的理论解释众说纷纭，“有多少学者就有多少主张和主义”。古希腊的伟大哲学家亚里士多徳说：“灵感就是在微不足道的时间里，通过猜测而抓住事物本质的联系”。波里亚把灵感通俗地解释为“好念头”。他写道：
	
	“向求解的突然进展称为‘好念头’、‘沙主意’、‘巧想法’、 ’灵机一动‘。什么是好念头？是我们观点上的一次重大突变，我们看问题方式的一个骤然变动，在解题步骤方面的一个刚刚露头的有信心的预感”。
	
	波里亚把“好念头”作为“灵感”的同义词，他说：”想出一个好念头是一种‘灵感活动’“，“好念头的出现，每个人都体验过，但只能心领神会而难于言传”。
	
	灵感与直觉相近。简单地讲，直觉就是直接的觉察，它是人们对客观事物的一种迅速而直接的洞察或领悟。灵感是直觉的特殊状态，往往表现为经过一段沉思之后突然产生新设想，思维过程特别迅速，像闪电一样。因此，直觉有时又称为灵感。
	
	灵惑的产生常常出现在思考对象已经不在眼前的时候。阿基米徳在浴盆洗澡时悟得浮体定律，牛顿从苹果落地悟得万有引力定律，都是得益于灵感。一般说来，某一事物或人物在人们头脑中迅速留下的第一印象，往往被称之为直觉，但这种思维状态均不属于灵感。
	
	钱学森教授在《关于形象思维问题的一封信》中明确指出，“灵感”在创造性思维中是“不同于形象思维和抽象思维的思维形式”。他第一次鲜明地把灵感现象作为人类的一种基本思维形式提了出来。他提倡创立一门“灵感学"。
	
	从思维方式看，灵感思维是从整体上对客观事物作出迅速而直接的判断，它不同于一般的逻辑思维，具有“非逻辑性”。 从认识发生看，灵感是一种突发性的创造活动；从认识过程看，灵感是一种突变性的创造活动；从认识成果看，灵感是一种突破性的创造活动，难怪人们经常用“蹦出”、“跳出”、“闯进”、“闪出”和“一闪念”等形象化的名词来描述灵感的非“逻辑性特征”。
	\subsection{灵感的触发}
	灵感产生但有随机性与自发性，依赖于机会。灵感可以被外界偶然机遇所触发，机遇是“发明家的上帝”。
	
	美国发明家莫尔斯在1832年发明电报。创造至今仍在使用的莫尔斯电码，以点（短时电流）、线（长时电流）和空（无电流）适当搭配代表字（字母）和数字。遇到最大问题是远距离传输发生信号衰减现象，他先使用放大原始信号方法，但没有成功。有一天，他搭乘驿车从纽约到巴尔的摩去，中途观察发现，邮车每到一个驿站就更换一次驿马，突然，他产生一个想法，在电报线路沿途设置信号放大装置，不断放大信号，终于解决信号远距离传输衰减问题。
	
	美国工程师杜里埃认为，为了保证内燃机有效的工作，必须使汽油和空气能够均匀的混合。可是怎么来实现这种混合呢？这个问题一直纠缠着他。1891年,他看到妻子喷洒香水，于是从这个化妆器具得到启发，创造了发动机的汽化器，其实，汽化器也是一个喷雾器。
	
	珍妮纺纱机的发明过程更为生动，1764年的一天，木工哈格里沃斯与以往一样，又为发明纺纱机的问题伤了一整天的脑筋。傍晚，他疲倦地站了起来，打算暂时丟开这个恼人的问题去做点家务。可是他一不小心，一脚将妻子的纺车给绊倒了。这时，一个现象竞使他看呆了，原来水平放置的纺锤倒过来以后变成垂直竖立了,却依旧在那里转动。哈格里沃斯由此想到，既然纺锤在垂直状态下仍然能转动，那么在纺纱机上并排垂直装上几个纺锤，不就可以一次纺出好几根纱来吗？就这样，他试制成功了新型的“珍妮纺纱机”，大大提髙了纺纱效率。
	\subsection{数学符号诱发灵感}
	既然自然标志和自然形象能够诱发灵感，作为富有数学思想的数学符号就更有更巨大的诱惑力。在数学研究中观察数学符号往往能够诱发灵感。
	
	莱布尼茨研究乘法计算机原理时，在很长时间内都没有找到合适解决方法，后来他收到一位法国传教士从中国寄给他的“八卦图”，他从图中得到启发，建立二进制数。
	
	卦基本符号是爻（音姚），分为阳爻和阴爻两种，合称“两仪”，每次取两种，共有四种排列方法，称为“四象（太阳、少阴、少阳、太阴）”。每次取三种，共有8种排列方法，称为“八卦（乾、兑、离、震、巽（音训）、坎、艮、坤）”。
	
	八卦通常用来代表不同事物，如东、东南、南、西南、西、西北、北和东北八个方位，还可以代替天、地、风、雷、水、火、山和泽八种自然事物等。
	
	莱布尼茨将阳爻看作数码1，阴爻看作数码0，于是四象分别代表不同二进制数。
	
	每次取六个爻，得到64个不同排列，称为64卦。可以用64卦代替0到63共计64个二进制数。
	
	如此看来，莱布尼茨创立二进制，正是由于受到“卦”和“爻”符号启发。
	
	不久，莱布尼茨发明当时最新型二进制乘法计算机。
	
	也有人提出莱布尼茨发明二进制数在他知道周易和八卦图前。莱布尼茨用二进制数原理研究八卦，破译了中国两千多年前创造的这套符号系统的秘密。这种说法同时也反映出符号诱发灵感功能--利用二进制数发现八卦图奥妙。正如徐利治先生说，许多数学界都有一种感觉，从符号中得到东西比输入的更多，它们好像比它们的创造者更聪明。有些符号似乎有一种神奇的力量，能在其内部传播变革和创造性发展的种子。
	
	面对困难，我们都期望自己头脑中闪现出奇妙灵感。虽然，灵感产生是不能预测的，但人们可以通过有意识的思考，诱发灵感。主要方法是，设法转化问题，多方位、多层次扩大联想，多渠道猎取灵感触发信息，提高机遇概率，一步一步地诱发灵感。猎取触发信息，当然包括从数学符号中猎取信息。
	
	G·波里亚在《数学的发现》一书中，提供到一个极为有趣的例子。其中，他细致地描述自己的发现过程，试图启发读者领会到灵感是怎么产生的。我们不妨借来考虑一番。
	
	已知：如图已知三个圆$X$、$Y$和$Z$半径均是$r$，且均通过点$O$，圆$X$和圆$Y$交与点$A$，圆$Y$和圆$Z$交与点$B$，圆$X$和圆$Z$交与点$C$。
	
	求证：$A$、$B$和$C$三点所确定圆半径为$r$。
	
	分析：由问题和求证可知，圆半径$r$作用很重要，需要在图中引入$r$。应该在那儿画圆半径$r$呢？因为三个圆和三个交点地位相同，所以应该同等对待。假设三个圆圆心分别为点$L$、$M$和$K$。连接$OL$、$OM$和$OK$。三个圆心和三个交点分别连接。图上线条很多，比较拥挤。
	
	对此，波里亚提示说，“它们有点像是老式杂志上某些画面，这种画有不止一种效果，如果你按通常方法去看它，它是一个图像，如果你转到另一个位置再换一个特殊方法去看它，那么另一个图像就会闪现在你眼前”。他又问，“你能从这张充满线条图像中看出有第二种含义图像吗？”
	
	也许你会隐约觉察到看似有些杂乱图像含有另一个直线图形，也许你会觉察到整个图形实质上是由其中直线所确定。因此，我们可以把注意力集中到图。波里亚又说：“这个图是有吸引力的，使我们想起一些熟悉的东西（想起什么？）”
	
	如果你仍然什么也没有发现的话，你可以将两个图做个对比，看看能够想起什么？
	
	显然，图中含有一个正四面体投影图形，因此比较容易想到，图含有一个不透明六面体投影图。原问题可以得到解决。因为立方体6条边等长，所以三条边分别为$r$。
	
	显然，图是平行6面体投影图形，因此通过比较容易想到，图也是一个不透明六面体投影图。原问题得以解决。因为，根据立体几何相关知识可知，如果选择一个平行六面体投影，可见9条棱长均为$r$，那么其余三条无法直接看到棱长均为$r$，即：
	$$EA=EB=EC=r.$$
	这种证明方法很巧妙，非常独特。一般来讲，人们总是习惯将立体几何问题转化为平面几何问题解决。这里却将平面几何看作立体图形投影。正如波里亚说：“如果设想读者遇到这样的事：从图那些纠缠在一起线段和字母中，平行六面体出乎意料地跳出来了，……可能他在某种程度上也将理解灵感这个词的含义，以及怎样解释好像是一个内在声音或一个超自然的神，在启示一样的一个深刻的想法突然出现”。
	
	本例中，波里亚通过观察几何图形，多方位观察，获得灵感。几何图形也是符号，正如希尔伯特所说，“几何图形就是直观空间的帮助记忆的符号，所有数学家正是如此使用它们的。”“算术符号是文字化的图形，而几何图形则是图形化的公式；没有一个数学家能够缺少这些图形化的公式，正如数学演讲中它们不能加减号或其他分析符号一样”。
	
	下面我们再看一个实例。
	
	计算定积分$\int_a^b\sqrt{(x-a)(b-a)}  \mbox{d}x(a<b) $。
	
	本例定积分可以用欧拉变换解决，但计算过程相当复杂。有没有更简单的方法呢？我们知道，定积分表示平面图形面积。这个定积分能不能和什么平面图形相联系？考虑到被积函数$\sqrt{(x-a)(b-x)}$是$(x-a)$与$(b-x)$比例中项，读者何须能够联想到几何中一条结论。如图，设$MN$是半圆直径，$PQ\perp MN$，则$PQ=\sqrt{MP\cdot PN}$。
	
	看来，$\sqrt{(x-a)(b-x)}$可以和半圆联系起来，这是一个好念头，事实上也可以做到。在图中，只要设法使$MP=x-a$，$PN=b-x$，则$PQ=\sqrt{(x-a)(b-x)}$。
	
	因此，得到下面解法。
	
	如图，设$A$和$B$是横坐标上任意两点，坐标分别是$a$和$b$，$R$是线段$AB$上任意一动点，坐标是$x$。则$AR=x-a$，$RB=b-x$，以$AB$为直径作圆，过$R$作$RT\perp AB$交圆于点$T$，则$RT=\sqrt{(x-)(b-x)}$。
	
	可见点$R$从点$A$移动到点$B$时，动点$T$轨迹是半圆曲线，根据定积分几何意义，可知所求积分值半圆面积。即
	\[
	\int_a^b\sqrt{(x-a)(b-x)}\mathrm{d}x=\frac{\pi}{2}(\frac{b-a}{2})^2=\frac{\pi}{8}(b-a)^2.
	\]
	解法很有特色，人们往往需要用定积分计算某些平面图形面积，本例利用几何知识，利用平面图形面积计算定积分。
	
	一般来说，在数学研究中，那些得益于灵感的方法总是很优美的，而数学符号则是诱发灵的感重要信息源。
	\chapter{数学符号创设原则}
	自1600年以来，数学创造的步幅一直处于增加的状态，出现不少新数学分支。不过，正如一位学者所说，谈到数学创造，我们自然想到其成果就是有关数学的新体系、新理论、新方法、新概念、新定理、新技术、新公式以及新应用等等。关于数学符号本身的创造却不容易被常人所注意。现在我们已经看到，数学符号与数学发展的关系是如此密切；数学符号的思维功能是如此显赫，研究数学符号的创设原则理应是非常重要的、不可忽视的工作。正如L•格莱希尔所讲：“初看起来，好像数学范围的扩张必定成为其未来发展的危险之源。……而标记法的改进可能最有效地简化课题和使之易于理解。不但要由数学工作者去探索新的真理，并要由他来设计可以用来发现和表达真理的语言，而在所得到的结果中，一个伟大的数学家也显示出其天才。恰当选择的标记法简化了复杂的理论并把远离的理论联系起来，我对这种标记法所具有的力量有极大的信心，同时，我认为有把握预言，不断增加的关于原则的知识以及不断改进的数学符号的语言，永远能使我们满意地对付仅仅由于这个学科的扩大所带来的困难。”
	
	关于数学符号的创设原则，尚未见到比较系统的论述，这—章，试图在这方面作些探索。
	\section{数学符号形成过程分析}
	考察历史大有好处。它能帮助我们建立正确的观念，了解客观事物发展的一般规律，展望客观事物发展的趋势和前景。在研究数学符号的创设原则之前，对现有数学符号的形成过程作些历史分析是有益的。
	
	\subsection{数学符号的种类}
	从数学符号的形成方式来看，现有的数学符号大致可分成象形符号、缩写符号和约定符号三种。
	
	象形符号是用符号的形状特征唤起视觉表象来反映数学概念的符号。数学对象的空间位置、结构或数置关系经抽象概括就得到备种数学图形或图式，图形、图式关系再经缩小或改造就形成象形符号。例如平面图形的符号$\angle,\Delta,\perp$等是原型压缩象形；关系符号$=$、$\equiv$、$\ne$、$\sim$、$\approx$等是原型改造符号。
	
	这类符号可由形思义地加以理解，记忆和运用。
	
	缩写符号中多数是由数学概念外文词汇前一个或几个字母构成缩写，也可以用汉语拼音类似构造进行缩写。例如函数f（function），实数集R（Real number）,极限lim(limit)。其他如微分、积分、对数、三角函数、最大最小、和与积记号$d$、$\int$、$\log$、$\sin$、$\cos$、$\max$、$\min$、$\sim$、$\pi$等均属于一类。
	
	这类符号最初需要以文字槪念的记忆为基础唤起听觉表象沟通思维活动，即由音思词、由词及义。
	
	约定符号的形成是与思维活动的习惯和历史有关的，并且具有思维的合理性等特点。例如习惯上用字母$x$、$y$、$z$等表示未知数，用$a$、$b$、$c$等表示已知数，用大写字母表示点，用小写字母表示线段或直线，用小写希腊字母表示平面。其它如方幂记号$x^n$、运算或性质记号$+$、$-$等、量词记号$\forall,\in$、阶乘记号$n!$等均属于这一类。
	
	这类符号主要应通过规定或约定的简炼性、合理性和习惯性来与思维活动共鸣，由义及形、形义一体地加以理解和运算。
	\subsection{数学符号与数学理论关系}
	从数学家提出新符号的心理过程来看，数学符号的创设与数学理论和方法密切相关，它总是由于研究某种课题的需要而受到某种数学思想的指引。在这方面最典型例子可算是微积分符号的创设过程。微积分是“一种撼人心灵的智力奋斗的结晶”， M•克莱因在他的《古今数学思想》中曾对莱布尼茨创设微积分及微积分符号的心理过程作过精辟的分析。它对于向往着数学创造的读者来说也许是非读不可的，我们简要介绍如下，从中可以看到“一个伟大的才智”是怎样“随着他思想发展而改变他所用记号”的。
	
	莱布尼茨在《微分学的历史和起源》一文中，把他微积分思想起源追溯到他关于研究数列和或差的序列的早期工作。
	
	莱布尼茨在1672年到达巴黎后不久，注意到有关数列的下述有趣事实。给定数列
	\[
	a_0,a_1,a_2,\cdots,a_n.
	\]
	考虑相继两项差序列
	\[
	d_1,d_2,\cdots,d_n.
	\]
	其中$d_i=a_i-a_{i-1}$，这时
	\[
	d_1+d_2+\cdots+d_n=(a_1-a_0)+(a_2-a_1)+\cdots+(a_n-a_{n-1})=a_n-a_0.
	\]
	因此，相继两项差的和等于原数列首项和末项差。
	
	对于平方序列
	\[
	0,1,4,9,16,25,36.
	\]
	第一阶差是
	\[
	1,3,5,7,9,11.
	\]
	第二阶差是
	\[
	2,2,2,2,2,2.
	\]
	莱布尼茨注意到自然数列第二阶差消失以及平方序列第三阶差消失等等，另外他还观察到，如果原序列是从0开始，那么第一阶差的和是序列最后一项。
	
	约1673年，莱布尼茨看到求曲线切线正问题和反问题重要性；他完全相信，反方法等价于通过求和来求面积或体积。为把前面所讲关于序列一些事实和微积分联系起来。他把序列看作是函数$y$值，而把任何两项差看作是相邻两个$y$值差。最初他认为$x$表示序列中项次序，$y$表示这一项值。
	
	量$\mathrm{d}x$，他经常写作$a$，这时候等于1，因为它是两个连接项序数差；$\mathrm{d}y$是两个相连项值实际差，然后用$omn
	_0$（拉丁文$omnia$缩写）表示和。并且用$l$代替$\mathrm{d}y$，莱布尼茨断言$omn.l=y$，因为$omn.l$是首项为0序列第一阶差的和，这样就给出最后一项。但是，$omn.yl$产生一个新问题，莱布尼茨获得$omn.yl=\dfrac{y^2}{2}$的结论是在$y=x$条件下考虑的。因此，如图所示，三角形$ABC$面积是$yl$和（$l$相对很小），它也是$\dfrac{y^2}{2}$。他说：“从0开始增长的直线，每一个与它相应增长的元素相乘，组成三角形。”这几点事实，和一些复杂的东西，已经出现在1673年论文中。
	
	下一阶段中，他必须从一串离散值过渡到$\mathrm{d}y$和$\mathrm{d}x$是$x$是任意值$y$增量的情况。因为他仍然局限于数列，而在数列中$x$是项顺序，所以他的$a$或$\mathrm{d}x$是1；因此，他自由插入或去掉$a$。当他过渡到任意函数$\mathrm{d}x$和$\mathrm{d}y$时，$a$不再是1。但是，他仍然在和概念作斗争时，已经忽略这个事实。
	
	因此，他在1675年10月29日手稿中，莱布尼茨从
	\begin{equation}\label{ee1}
	omn.yl=omn.omn.l\frac{l}{a}
	\end{equation}
	出发，因为$y$本身就是$omn.l$，所以\ref{ee1}是成立的。他用$a$除$l$保持量纲，他说，无论$l$等于什么，\ref{ee1}是成立的。但是，我们已经在图中看到：
	\begin{equation}\label{ee2}
	omn.yl=\frac{y^2}{2}.
	\end{equation}
	所以，由\ref{ee1}\ref{ee2}得
	\begin{equation*}
	\frac{y^2}{2}=omn.onm.l\frac{l}{a}.
	\end{equation*}
	用近代符号来写，就是
	\[
	\frac{y^2}{2}=\int{\mathrm{d}y}\frac{\mathrm{d}y}{\mathrm{d}x}=\int y\frac{\mathrm{d}y}{\mathrm{d}x}.
	\]
	他说，这个结论是值得称赞的。
	
	莱布尼茨从几何证据中得来另一个同类型定理是
	\[
	omn.xl=xonm.l-onm.onm.l
	\]
	其中	$l$是某个序列相邻两个项差，$x$是项数，用近代写法，这个方程就是
	\[
	\int x \mathrm{d}y=xy-\int \mathrm{d}x.
	\]
	莱布尼茨假设式中$l$本身是$x$，可得到
	\[
	omn.x^2=x.omn.x-omn.onm.x
	\]
	他说，但是$omn.x$是$\dfrac{x^2}{2}$（已证明$omn.yl=\dfrac{y^2}{2}$），所以
	\[
	omn.x^2=x\frac{x^2}{2}-omn.\frac{x^2}{2}
	\]
	由移至最后一项，他得到
	\[omn.x^2=\frac{x^3}{3}.\]
	在1675年10月29日手稿中，莱布尼茨决定用$\int$代替$omn.$；因此
	\[
	\int l=onm.l,	\int x=\frac{x^2}{2}.
	\]
	记号$\int$是符号“$Sum$（和）”首字母$S$变体。
	
	可能是研究巴鲁著作缘故，莱布尼茨很早就意识到，微分和积分是相反过程；所以面积被微分时，必定给出长度。因此，在10月29日另一篇手稿中，他说：“已知$l$与$x$关系，求$\int l$。然后，他说，假定$\int l=y_a$，设$l=y_a/d$，……$\int$意味着和，$d$意味着差。从已知$y$我们总能求出$y/d$或者$l$，即$y$的微差。”
	
	这里，莱布尼茨似乎是在探索$\int$和d运算，并看出它们是相反的。意识到$\int$实际上是矩形和，因而是面积和。他承认，要从$y$回到$\mathrm{d}y$，必须做$y$微差或取$y$微分。然后他说：“但是$\int$意味着和，$d$意味着差。”（克莱因评论说：“这可能是后来加进去的”）。因此，从两个星期后，为了从$y$得到d$y$，他从用$d$除改成作$y$微差，并写作d$y$。
	
	在此前，莱布尼茨还认为$y$值是序列项值，$x$通常作为项序数。但是现在，这篇论文中他说：“所有这些定理对那些级数是正确的，在这些级数中项的差和项本身之间比小于任意指定量”。这就是说：“d$y/y$可以小于任意指定量”。
	
	在1675年11月11日，标题为《切线的反方法的例子》手稿中，莱布尼茨用$\int$表示和，$x/d$表示差。然后他说：“$x/d$是d$x$，是两个相邻$x$差，但是显然这里d$x$ 是常数，并且等于0”。
	
	根据上面勉强可以理解的议论，莱布尼茨断定一个事实：“作为求和过程积分是微分逆过程，但他不知道怎么从一个粗糙式子$\sum y\mathrm{d}x$去得到面积--即怎么从一组矩形得到曲线面积。”由于没有严格极限定义，或者面积也没有严格定义，莱布尼茨有时认为后者是非常小且又是非常多矩形和，因而这个和曲线下真正面积差是可以忽略的；有时又认为是纵坐标$y$的和。
	
	关于微分，莱布尼茨在巴斯卡和巴鲁曾用过特征三角形建立他的理论。三角形由$dy$$dx$和弦$PQ$组成，他认为弦$PQ$“是处于$P$和$Q$ 曲线，而且是$T$点切线一部分“。虽然这个三角形是无穷小的，但坚持它和确定三角形是相似的，即相似于切线$SU$，$T$点纵坐标以及切线$ST$组成三角形$STU$。因此，$dy$和$dx$是最终元素，它们比有确定意义。事实上，他用三角形$PRQ$和$SUT$相似论据得到$dy/dx=TU/SU$。
	
	手稿中，莱布尼茨说明他怎样能解答一个特定问题。他寻求次法线与纵坐标成反比曲线。在图中。法线是$TV$，次法线是$UV$。由三角形$PRQ$和$TUV$相似性，他得到
	\[\frac{dy}{dx}=\frac{p}{y}\]
	或者
	\[pdx=ydy\]
	曲线有已知性质
	\[p=\frac{b}{y}\]
	其中$b$是比例常数，因此
	\[dx=\frac{y^2}{b}dy\]
	所以
	\[
	\int dx=\int\frac{y^2}{b}dy
	\]
	即
	\[x=\frac{y^3}{3b} \]
	他还解决其他反切线问题。
	
	在1676年6月26日手稿中，他意识到求切线最好方法是求$dy/dx$，其中$dy$和$dx$是差，$dy/dx$是商。忽略$dx\cdot dx$和$dx$高次幂。
	
	约1676年11月，它能够给出一般法则$dx^n=nx^{n-1}dx$和$\int x=\dfrac{x^{n+1}}{n+1}$，其中$n$是整数或分数。他说：”这个道理是普遍的，不管$x$序列是什么样的。“$x$仍然意味着序列项的次序。在这篇手稿中，他说要微分$\sqrt{a+bz+cz^2}$，设$a+bz+cz^2=x$，微分$\sqrt{x}$，乘以$dx/dz$，就是链式法则。
	
	1680年，$dx$成为横坐标差，$dy$成为纵坐标差。他说：”现在把$dx$和$dy$取为无穷小，或者把曲线上两点理解为它们中间距离比任何给定长度都小……“。他把$dy$称作$y$沿横坐标移动时”瞬时增长“。但如图中$PQ$，被认为仍然是直线一部分。是“曲线一个元素，或者是代替曲线的无穷多角多边形一条边。“他继续用通常微分形式。例如，如果$y=a^2/x$，则
	
	他还说差是相反于和的。因此为得到曲线下面积。计算矩形面积和不能忽略剩余”三角形，因为他们同矩形相比是很小，……因此，我在微积分中，用$\int ydx$表示面积……“。
	
	尽管他先前说过，$dx$和$dy$是很小差值，但他仍然谈到序列。他说：“差与和是彼此相反的，也就是说，一个级数差的和是级数项，级数和的差也是级数项，所以我用$\int dx=x$表示前者，用$d\int x=x$表示后者”。事实上，在1684年以后手稿中，莱布尼茨说他的无穷小方法已经众所周知的作为差的微积分了。
	
	莱布尼茨在微分方面首次发表文章是在1684年《教师学报》上。
	
	对于$dy$、$dx$和$dy/dx$含义，莱布尼茨仍然是含糊的。他说$dx$是两个无限接近点$y$值差。切线是连接这样两点的直线。虽然他在各节无穷小量之间作过区别，但是他没有经过证明就去掉高阶积分。
	
	正如克莱因所说：“莱布尼茨工作，虽然如此零碎不全，以致几乎不能理解，但富有启发性且意义深远”。“莱布尼茨煞费苦心工作，要把记号选的最好。他的$\mathrm{d}x$、$\mathrm{d}y$和$\dfrac{\mathrm{d}x}{\mathrm{d}y}$仍然是标准的。他引进记号$\log x$，对于$n$阶微分引入$d^n$。甚至对$\int$与$n$重和分别引入$d^{-1}$与$d^{-n}$”。
	\subsection{数学符号演变}
	从数学符号演变过程来看，数学符号总是在交流传播过程中不断改进，要受到文化、经济、技术和印刷条件等等社会背景影响，有些甚至经过戏剧性变化。
	
	例如根号“$\sqrt{\quad}$”，18世纪有些数学家（例如欧拉）猜想$\sqrt{\quad}$是$radix$（拉丁文）单词首字母$r$变形，但经过研究证明不是。德国人在1480年前后，使用$\cdot$表示平方根，如$\cdot3$表示3平方根，$\cdot\cdot$表示4平方根。而$\cdot\cdot\cdot$表示立方根。16世纪又有变形，但书写很不方便，1525年，产生和现代写法有些部分类似写法。
	
	我国数学史符号演变过程中，也表现出某种偶然性。我国古代用空格表示零。古书缺字用方块表示，数字间缺位，也用方块表示。在书写时，常常用行书，方块也很容易划成圆圈。以零表示0，早在金《大明历》中见到。以后逐渐推广更大量使用。也有人认为是从外国传入。
	
	数学符号的形成过程如此复杂，似乎就没有什么创设原则可谈了。其实不然，数学符号的产生决不是自生自灭的，也不是数学家随心所欲的。我们已经看到，数学符号的创造总不会脱离数学理论和方法去孤立地进行，他要受到数学思想的影响。散见在各种数学著作中的许多片断表明：对于优秀符号的创设，数学家总是自觉地或不自觉地、或多或少地遵循着一些科学原则。正如美国两位数学家所说：“适者生存”，一切数学符号， 凡是符合这些科学原则的才得以“生存”，否则，必然被淘汰。 足见，我们从中总结出数学符号的创设原则不仅是必要的，也是完全可能的。
	\section{创设数学符号基本原则}
	数学符号的功能是用于传播数学思想，认识数学世界的奥秘。因此，创设数学符号的总的原则是：有利于数学思想的交流和传播；有利于发挥其思维功能；有利于数学的发展。具体地讲，数学符号的创设，应该遵循下面几个基本原则。
	\subsection{确定性原则}
	我们知道，任何符号都包括两个方面，即能指与所指，符号功能是建立在能指与所指之间的约定关系基础上的。“能指与所指之间的关系，在任何情况之下都是约定的。”包括按符号使用的自然标志。数学符号也不例外，数学符号的意义是需要解释的，解释符号就是使它同某些具有现实意义的槪念或心智想象相联系。所谓象形符号和缩写符号也是约定俗成的符号。
	
	约定可以明显的，也可以不明显的。另外，约定槪念是相对的，约定有程度上的区别：它可以是很严格的，也可以是不怎么严格的；可以是ー致的，也可以是不大一致的，可以是受某种限制的，也可以是不怎么受限制的，在数学符号中，能指与所指之间的关系的约定是严格的、几乎是一致的。
	
	数学作为一门要求十分精确的学科，它以逻辑的严格性和结论的确定性而著称，要求一种准确性很强的语言与之相适应。“数学中不存在那种意义含混的词”。因此，数学要求每一个符号都有确定的含义。
	
	在自然语言中，一个能指可以指向好几个所指。例如，“号” 作为能指，其所指可以是乐队用的一种乐器， 也可以是一个“大声呼喊"、“大声哭”的动作。但在数学中，“成功的研究依赖于构想合理的标记”，而“合理的标记法，总要不含糊、不混乱地表达基本数学的本质”。因此，在数学符号中每个能指只能指向一个所指。这就是含义确定性原则。
	
	上一节中我们提到，1525年骆多尔夫代数书中所使用的根号符号很多不符合确定性原则，导致含义确定性丢失。笛卡尔对此作出修改，才形成现代根号形式。
	
	牛顿所创立部分微积分符号也存在很多含混的地方。最突出例子是，他用0表示瞬（无穷小量），很容易和普通符号0混淆。0究竟是不是“零”？牛顿认为不是，既然如此，为什么在实际运算中可以略去含有0次幂项呢？牛顿没有给出合乎逻辑的说明。
	
	必须指出，“所谓每个能指只能指向一个所指”是相对于一个系统所言。例如，符号“1”在集合代数中有确定含义--元素1;但在命题代数中，含有另一个意义--真命题。因此，同一个数学符号可以有多个意义或解释，只要这些解释能够具体说明数学符号表示抽象物与其具体关系。与数学符号确定性原则是不矛盾的。
	\subsection{简明性原则}
	数学语言重要特征之一就是简洁性。在数学中，叙述一个概念在准确、完备的前提下，力求简洁，话虽不多，但意思能够表达清楚。使用数学符号语言往往能够大幅度缩减自然语言表达“长度”，做到言简意赅。为保证数学语言具有简洁性，数学符号创立应该遵循表达简明性原则。
	
	简明性原则是由符号本质所决定的，符号是传播意愿的标志，既然是标志，就力求表达简明。“简单明了”是美的体现。皮亚诺曾指出，“在两种符号体系中，符号用得较少的一般是更可取的”。数学史表明，一切数学符号的演变过程总是服从逐步简明化的规律。
	
	罗马数码在表达方面不具有洁明性，“一个简单的数要写成长长的一串”。因此，印度-阿拉伯数码问世后，罗马数码必然要被淘汰。任何一种新的改革，总会遇到阻力。印度-阿拉伯数码也曾遭到一些人的猛烈反对。其理由是:这些数字“奇形怪状”，长时期未能标准化；0这个数字尤其容易弄错； 需要耐心学会很多道理后才能正确使用这些新符号。另外，当时反对者还有一个“更为有力、颠扑不破”的理由；新数字太容易弄虚作假了。0很容易改为6或9，1也容易改成4, 6，7或9,其他数字的形式也可以窜改，往往还可以在已经写下的几个数字中间或后面插进一些数字。正是由于可能发生这些弄虚作假的现象，1299年佛罗伦萨的法令中就禁止在金融事务中使用印度-阿拉伯数码而强迫使用罗马数码。
	
	然而，印度-阿拉伯数码的种种优点，给人以挡不住的美的感受，它最终还是为人们所普遍釆用。
	
	用算筹表示数目，在我国数学史上曾起过很大的积极作用，但是，它与印度-阿拉伯数码相比，在表达方面就显得不够简明。
	
	关于分数符号，我们在前面一些章节中谈到，阿尔·哈萨著作中，分数表达式还是不够简明的。更准确说是“简而不明”。
	
	斐波那契《算盘书》中，式子从右到左，整数部分写在分数右边，例如将$12\dfrac{1}{2}x$写成radices$\dfrac{1}{2}12$；14世纪中叶还有其他写法。和现行分数符号相比，可以看出这些表达式还是不够简明。
	
	分数指数最早出现在奥力森《比例算法》一书中，但因为缺少简明性而被淘汰。模棣尔曾批评过他的繁琐写法，他认为从传播角度来说，不应该在理解的方式上给对方增加负担。
	
	数学符号用以表示数学抽象物。数学抽象物具有抽象层次上区别。例如不同基数集合，不同价微分，不同维度空间间运算关系等等。因此，合适的数学符号系统，不仅要能够反映同一层次不同数学抽象物的差别，还要能反映不同抽象抽象层次的差别，即显示出不同的抽象度。因此，表达的简明性，也包括简明地表达各层次数学抽象物。在微分时代，牛顿和许多英国数学家使用$\dot{x}$和$\dot{y}$，莱布尼茨和许多德国数学家使用$\mathrm{d}x$和$\mathrm{d}y$。两派争论几个世纪，最后，莱布尼茨符号占据优势。其中一个原因就是莱布尼茨符号体系更适于表达高阶导数和高价微分，且可以由正整数阶推广到负数阶和分数阶，导致运算微分发展，对后世数学研究产生很大影响。
	\subsection{方便性原则}
	方便性原则是指数学符号的创设要考虑到使用方便，包括读、写、运算及推理的方便，甚至还包括便于利用计算器械。
	
	方便性原则也是由符号的本质所决定的，数学符号作为交流数学思想工具，其重要价值就在于使用的方便性。
	
	罗马数字对于加、乘运算就极不方便；用算筹表示数字，其运用的方便性也不及印度-阿拉伯数字。
	
	数$e$为什么“可贵”，其原因之一就是自然对数$\ln x$求导运算方便，由此又为髙等数学乃至一切自然科学带来一系列的方便。
	
	行列式与矩阵的引入，其目的是为了“速记"，也就是为了方便。
	
	二进制为什么得宠，其原因就是它便于电子计算机采用。
	
	首先，二进制只需0和1两个数码就可以表示一切数目。这对于机器来说最为有利，可以大大简化计算机的“运算器”， 每一数位上的数字1和0最适宜表示为电路中电气信号的存在或消失。例如，“ 1”表示为电压脉冲的存在，“0”表示脉冲的消失。这样，二进位制的任何数就可以用排成一定顺序的脉冲表示。因此，只要找到一种具有两种稳定状态的元件就可以用二进制表示数了。而这种元件是很多的，例如：电灯的“开”与“关”，磁蕊的“充磁”与“消磁”，纸带的“穿孔”与“无孔”，晶体管的“通导”与“截止”等等。如果在计算机上采用其他进位制，則需要具有多种稳定状态的元件，比如十进制就需要具有十种稳定状态的元件，这在技术上是很困难的，而且线路复杂，造价昂贵。
	
	其次，二进制的运算比较简单，可以大大提高运算速度， 这对于电子计算机来说是至关重要的。从二进制的加法表与乘法表大小可以看出：对于每一个一位数字来讲，二进制加或乘只有四种状态，十进制加或乘各自有100种情况，由此可见运算繁琐情况。
	
	另外，二进制不仅可以进行数值计算，还可以进行二值逻辑计算。把“1”看作真命题逻辑值，把“0”看作假命题逻辑值；规定逻辑加、逻辑乘与逻辑非运算规则，电子计算机机就能进行判断和推理，机器人也就有某些人类思维能力。
	
	二进制”1“与”0“还可以表示生物神经系统兴奋与抑制两种状态，为此，神经系统可以与电子线路二进制网络类比。电子计算机以离散二进制原件为基础，可以作为神经系统某些功能机制理想模型。
	
	某些数学符号存在与否取决于是否便于使用。数学符号和一切劳动工具一样，总是在使用方便性上逐步改进。已经成为诱导数学符号演变的无形推动力。我们知道，我国古代，数字间空位用方框表示，为书写方便，方块变成圆形。乍看起来，形成0似乎有些偶然，其实，偶然中包含必然，人们为求书写方便和快捷，把方框写成圆圈，本身就说明在使用方便性上圆圈胜过方框。虽然无意，但圆圈一经出现，就必然取代方框，“无心插柳柳成荫”。
	\subsection{启发性原则}
	为了能运用数学符号“有效处理新事物，把握其含义和价值”，认识数学世界的奥秘，要求数学符号具有暗示作用，有利于刺激联想，启发思维。这就是创设数学符号的启发性原则。
	
	数学符号，如$\parallelogram$、//、$\odot$等等，都是富有启发性的，人们看到这些符号形式，就会想到符号所表示的数学抽象物。正如希尔伯特所说：“新符号必须服从新概念。我们用这样方式选择符号，使得它们会令人想到曾经是形成性概念的缘由的那种现象”。
	
	关于两个相似三角形符号
	\[\triangle  ABC \sim \triangle  EFG.\]
	现代书写方式总是默认三角形顶点都按照一个方向一一对应，即$\angle A=\angle E$，$\angle B=\angle F$，$\angle C=\angle F$。但古书中并没有类似约定俗成规定，为判断那个顶点和那个顶点对应，读者需要看图或记住推导情况。
	
	现代记法显然比古代记法有优势，使用现代记法，富有启发性。我们不必看图，我可以得出很多结论。例如：
	\[\angle A=\angle F\]
	\[AB:BC=EF:FG\]
	以及其他类似关系。
	
	细想一下，古代记法和现代记法差别仅仅在于描述文字顺序不同而已，然而，现代记法更充分反映事物次序和联系，就可能提供更丰富含义。可见，在启发性方面精心设计符号是很有必要的。
	
	莱布尼茨总是竭力使他创造的符号富有启发性，他写道：“为我们提供一条阿里阿德湟线\footnote{阿里阿德湟是古希腊神话中克里特王弥诺斯女儿，传说雅典每年需要进贡7对童男童女，作为迷宫中牛首人身怪物米诺陶洛斯食物。英雄忒修斯作为贡品来到克里特，阿里阿德湟对他一见钟情，给他一个线团进入迷宫杀死怪物，原路返回。后来，人们用”阿里阿德湟线“比喻能够摆脱困境的方法。}，即一种看得见、摸得着的媒介，以便用来引导思维，就好像几何学图形和初学算数运算公式那样。”
	
	莱布尼茨所创设的微积分符号的确满足他的目标，可以作为一种“看得见、摸得着的媒介，以便用来指导思维”。下面提供几个实例。
	
	使用拉格朗日符号所引入的函数符号，我们可以把求导运算链式法则表达为：如果$h(x)=f(g(x))$，则
	\[h^{\prime}(x)=f^{\prime}(g^{\prime}(x)).\]
	不过，公式中符号既没有说明公式为什么成立，也没有说明怎么证明它。如果使用莱布尼茨微分符号，设$z=f(y)$，$y=g(x)$，则公式成为
	\[\frac{dz}{dx}=\frac{dz}{dy}\cdot\frac{dy}{dx}\]
	对比下，这个公式具有启发性，公式本身显得会让我们认为它成立，因此，只要把右边两个$d$$y$互相抵消，就好像它们是实数一样。此外，消去微分符号想法还会引导我们想到公式证明方法，即用有限增量$\Delta x$、$\Delta y$、$\Delta z$分别代替微分$dx$、$dy$、$dz$取极限。这个证明方法被很多现代数学课本采用。
	
	链式法则积分形式是代换积分公式
	\[
	\int f(g(x))g^{\prime}(x)\mbox{d}x=\int f(u)\mbox{d}u.
	\]
	由符号代换$u=g(x)$，$\mbox{d}u=g^{\prime}(x)\mbox{d}x$可以相信这个公式成立，而不论它证明如何。说明微分形式$f(u)\mbox{d}u$在任意变量变换下具有不变性。这是莱布尼茨的重要发现之一。
	
	还有一个典型事例。现考虑由曲线$y=f(x)$绕$x$轴旋转产生曲面。莱布尼茨把曲线无穷小一段$\mbox{d}s$看作两直角边为$\mbox{d}x$、$\mbox{d}y$“特征三角形”斜边。由勾股定律得到
	\[
	\mbox{d}s=\sqrt{(\mbox{d}x)^2+(\mbox{d}y)^2}=\sqrt{1+(\frac{\mbox{d}y}{\mbox{d}x})^2}\mbox{d}x
	\]
	当$ds$绕$x$轴沿半径为$y$圆旋转时，生成无穷小面积
	\[dA=2\pi yds=2\pi y\sqrt{1+(\frac{dy}{dx})^2}dx\]
	
	可见，使用莱布尼茨微积分符号，经过程式化、合乎情理的推理，就可以得到曲面面积公式。其实，要严格证明公式有些麻烦，它要求对曲面面积概念进行详细讨论，给出严格面积定义，然后证明它和上述公式一致的。
	
	正因为莱布尼茨微积分富有启发性，因此，“它所释放的能量比投入的多”。
	\subsection{和谐性原则}
	和谐性是数学美的重要标志之一，和谐的概念最早就是由毕达哥拉斯学派以数学的观点研究音乐而提出的，他们发现音乐在质的方面的差异是由声音在量的方面的比例差异决定的，因此，认为音乐是对立因素的和谐的统一。美就是由杂多导致统一，由不协调导致协调。数学家非常重视他们的方法和理论是否优美，那么到底是什么使我们感到优美呢？彭加勒指出：“那就是各个部分之间的和谐，对称和恰到好处的平衡。”量子力学创始人海森堡也说过：“美是一个部分与另一个部分及与整体的固有的和谐。”作为现代数学三大特点之一的严谨性， 正是反映了数学体系的和谐美。
	
	数学语言是由符号组成的，创设数学符号必然要遵循和谐性原则--考虑各个符号之间的和谐关系。
	
	对于某些有关联的数学抽象物要赋之符号，特别要注意符号之间和谐性。数学中，很多数学概念的意义，是随着数学的发展而逐步变化、逐步丰富的，为了使概念适用于更大的范围， 就必须扩展原有的槪念，重新给它定义。其间，我们赋予的一系列符号就必须是相互和谐的。
	
	例如，指数符号的创设。韦达对数学符号颇多改良，但没有创设优良的指数符号。英国瓦利斯最早提出负指数，在他的《无穷小算术》中有这样的话：“平方数倒数数列$\dfrac{1}{1}$，$\dfrac{1}{4}$，$\dfrac{1}{9}$，$\cdots$指数是$-2$，立方数倒数数列$\dfrac{1}{1}$，$\dfrac{1}{8}$，$\dfrac{1}{27}$，$\cdots$指数是$-3$，两个数列项数依次相乘，得到“5次幂倒数”数列$\dfrac{1}{1}$，$\dfrac{1}{32}$，$\dfrac{1}{243}$，$\cdots$，指数显然是$-2-3=-5$，平方根倒数数列$\dfrac{1}{\sqrt1}$，$\dfrac{1}{\sqrt2}$，$\dfrac{1}{\sqrt3}$，$\cdots$指数是$-\dfrac{1}{2}$，$\cdots$”
	
	这是一个很大的进步，不过瓦利斯没有真正使用$2^{-2}$、$2^{-3}$和$2^{-\frac{1}{2}}$作为指数符号。只是说$\dfrac{1}{4}$，$\dfrac{1}{8}$，$\dfrac{1}{\sqrt2}$指数是$-2$、$-3$和$-\dfrac{1}{2}$。
	
	现代数学所使用分数指数和负指数符号是牛顿创立的。他在1676年6月13日写信给莱布尼茨，信中写道：“因为现代数学家将$aa$，$aaa$，$aaaa$等写成$a^2$，$a^3$，$a^4$等等，所以我将$\sqrt{a}$，$\sqrt{a^3}$分别写成$a^{\frac{1}{2}}$，$a^{\frac{3}{2}}$；又将$\dfrac{1}{a}$，$\dfrac{1}{aa}$写成$a^{-1}$，$a^{-2}$，$\cdots$”
	
	瓦利斯和牛顿考虑到相关概念以及运算中具有和谐关系。
	
	考虑到和谐性，不仅是创设数学符号的客观要求，也是创造数学符号的一种成功经验与方法。
	
	阶乘符号$n!$是怎么引入的？当$n$是自然数时，$n!$表示从1开始$n$个自然数乘积。即
	\[n!=1\cdot2\cdot3\cdot\cdots\ \cdot(n-1)\cdot n.\]
	
	我们知道任何符号总包含两个方面，一是符号形式，二是符号内容。有些计算要求重新规定$0!$意义，也就是要给符号形式$0!$赋予符号内容，怎么规定呢？
	
	考察公式
	\[\mathrm{C}^n_m=\frac{m!}{n!(m-n)!}\]
	公式中$m,n$是自然数，且$m\geqslant n$，当$m=n$时，公式左边$\mathrm{C}^n_m=1$，公式右边出现$\frac{m!}{m!0!}$。
	
	为了使公式在$m=n$时公式仍然成立，就需要规定$0！=1$。因此，规定$0!=1$是考虑公式和谐性必然结果。
	
	很奇妙，这个规定还可以保证更高层次和谐性。
	
	18世纪，欧拉出于研究插值理论和反微分两个问题需要，考察积分
	\[ \int_{0}^{\infty}x^{\sigma-1}e^{-x}dx\quad(a>0)\]
	
	勒让德称它为伽玛函数。用$\Gamma(a)$表示。
	
	即：$$\Gamma(a)=\int_0^{\infty}x^{\sigma-1}e^{-x}dx$$。
	
	伽玛函数是继初等函数后，在分析与分析应用中最为重要的函数之一。
	
	利用分部积分，可得
	\[a\int_0^{\infty}x^{\sigma-1}e^{-x}dx=x^{\sigma}x^{-x}\mid_0^{\infty}+\int_0^{\infty}x^{\sigma}e^{-x}dx\]
	即
	\[\Gamma(a+1)=a\Gamma(a).\]
	重复应用公式可知
	\[\Gamma(a+n)=(a+n-1)(a+n-2)\cdots(a-1)a\Gamma(a).\]
	
	利用公式，无论对于多大值$a$计算$\Gamma$，都可以转化为对于$a<1$计算$\Gamma$。
	
	式中取$a=1$，并注意到
	\[\Gamma)(1)=\int_0^{\infty}e^{-x}dx=1\]
	发现$\Gamma(n+1)=n!$，得到公式
	\[n!=\int_0^{\infty}x^ne^{-x}dx.\]
	其中$n$是自然数。
	
	这项发现重要性主要在于给出$n!$分析表达式。大数阶乘，无论是理论研究，或者是实际计算，都有很大意义，但是，大数阶乘，按照定义，是一个复杂且不便于估计数值的事物，不要说精确值，甚至连数量级也无法取得，所以无论对于理论还是实际应用来说，当$n$很大时，能找一个取得$n!$极简单又便于估计的近似表达式，是一件很重要的事情，这个著名公式为这项工作奠定了基础。
	
	需要指出公式在$n=0$时是成立的。也就是说规定“$0!=1$”与该公式是和谐的。这并不是偶然的巧合。不同数学概念，存在内部联系，按成功的经验进行创造往往是很顺利的。正如希尔伯特所说：“数学家们所经常感到的那令人惊讶的相似性和仿佛事先有所安排的协调性，其根源就在于思维与经验的相互作用”。
	\section{为实际需要而创造}
	我们已经看到莱布尼茨创设微积分符号，完全为了研究微积分方法的需要，其间，他随自己思想的发展，不断更新他的符号，微积分方法的发明与微积分符号的发明表现出一种同步过程，难怪有人问：“莱布尼茨究竞是发明了微积分还是微积分符号?数学史表明，一切符号都不是数学家凭空创造出来的， 而是由于数学研究的需要，伴随着数学方法的创新而创造的。如果把这个也作为一条原则的话，那就是要为数学研究的实际需要而创造。
	
	伽罗瓦曾说过：“新颍问题需要使用新名称，新符号。我不怀疑，这种不方便在开头的时候将便读者产生反感，他们很 难原谅这种生疏的语言，即使作者是他们素所景仰的人。但是归根到底，我们只好适应题目的要求，因为题目的重要性值得注意，”伽罗瓦建立方程式可解性理论的重要关键就在于他对置换群引进了一系列重要概念（如“正规子群”、“单群”、 “复解”以及群与群之间的“同构”等）及其相应的符号。他开辟了代数学的崭新领域--群论。在数学史上群论的发明可以与解析几何、微积分的发明比美。伽罗瓦被誉为数学史上的头等天才。人们谈到数学的发明创造总会谈到伽罗瓦理论，我 们谈数学符号的创造也不能放过它。
	
	事情必须从代数方程的根式解法谈起。
	
	代数基本定理从理论上肯定了代数方程根的存在性,然而，它的各种证明都不是构造性。没有指出求根的一般途径。那么，怎样求出方程的根呢？
	
	二次方程的解法，早在远古时代已解决，三次、四次方程的解法是在16世纪解决的，这些方程的解法有一个共同的特点，它们的根都可以用它的系数的代数式来表示，所谓代数式,就是只含有限次的加、减、乘、除和开方五种代数运算的表达式。因此，人们说以上方程可以用代数方法求解，或者说以上方程均有解。自从三次、四次方程根式解法解决后，五次方程求解问题自然而然被提到议事日程上来，吸引众多数学家，包括欧拉在内。但是200多年努力均宣告失败。它们认为五次方程求根公式存在，只是没有发现而已。
	
	18世纪下半叶，拉格朗日精心分析二次、三次、四次方程求根公式后，引入方程预解式概念。
	
	以二次方程为例。二次方程
	\[ax^2+bx+c=0\]
	求根公式是
	\[x_{1,2}=\frac{-b\pm\sqrt{b^2-4ac}}{2a}.\]
	拉格朗日发现$\sqrt{b^2-4ac}$与两根$x_1$和$x_2$有密切联系，$\sqrt{b^2-4ac}=x_1-x_2$记作$\phi(x_1,x_2)=x_1-x_2$，$\phi$是二次方程预解式。为什么叫预解式？根据韦达公式
	\begin{equation}
	\begin{cases}
	x_1+x_2=-\dfrac{b}{a} \\
	x_1x_2=\dfrac{c}{a}
	\end{cases}
	\end{equation}
	只要能将$\phi$（即$x_1-x_2$）用$b,c$表示，则可以解出二根$x_{1,2}$。
	
	拉格朗日看出，预解式和方程根置换性质有关，他拟定一种解$n$次方程方案，并用方案成功且统一地处理了二、三、四次方程根式解问题。可是，当他试图处理五次方程时碰壁了，最后只能被迫得出结论，一般高次方程（$n>4$）根式解看起来是不存在的。
	
	稍晚些，阿贝尔严格证明五次以上一般代数方程不可能有一般形式根式解。但是这并不等于说任意一个具体数字系数高次方程都没有根式解。阿贝尔还是没有彻底解决代数方程根式解问题，余下任务是确定那些方程可用根式求解，伽罗瓦理论正是为解决这个问题而引起的。
	
	受拉格朗日影响，伽罗瓦相信方程是否有解与方程诸根置换性质有内在联系。一个$n$次方程$n$个根$x_1,x_2,x_3,\cdots,x_n$共有$n$个可能置换，它们集合关于置换乘法构成一个群，叫作根置换群。方程可解性可以在根置换群某些性质中反映出来。基于这个认识，伽罗瓦把方程论问题转化为群论问题来解决。
	
	大家熟知，代数方程根式解公式是具有“层次式结构”的。例如二次方程求根公式包含一次平方根，三次方程求根公式包含两层根号，里面一层是平方根公式，外面一层是立方根公式。一般来说，一个高次代数方程如果存在根式求解公式，则公式中必将包含开方根构成的一些层次。伽罗瓦基本思想方法是把层次结构的形成同域的不断扩张概念联系起来；把每一个层次的对应域的形成要素归结为预解式和预解方程的寻求，把预解式的寻求归结为置换群各阶子群结构分析。
	
	伽罗瓦曾考虑一类特殊方程
	\[x^4+px^2+q=0\]
	这是一个可用根式求解的方程。我们从这个方程入手，考察可用根式求解的方程的特性，从而阐明伽罗瓦思想方法要点。
	
	令$R_0$是由$p$和$q$有理表达式所形成的域，这些表达式系数在有理数域中。按照伽罗瓦的说法，$R_0$是	由添加字母$p$、$q$到有理数域中得到的域。这个域$R_0$叫作给定方程的系数域，而这个方程就说是属于这个域$R_0$。伽罗瓦并没有用域这个概念，但却使用过这个概念。
	
	不难看出，这个方程根是
	%$$x_1= -\sqrt[4]{(-px^2 - q)}, x_2=-I (-px^2 - q)^{(1/4)}, x_3=(-px^2 - q)^{(1/4)}, x_4=(-px^2 - q)^{(1/4)}.$$
	$$x_1=\sqrt{\frac{-p+\sqrt{p^2-4q}}{2}},x_2=-\sqrt{\frac{-p+\sqrt{p^2-4q}}{2}}.$$
	$$x_3=\sqrt{\frac{-p-\sqrt{p^2-4q}}{2}},x_4=\sqrt{\frac{-p-\sqrt{p^2-4q}}{2}}.$$
	这些根满足
	$$x_1+x_2=0,x_3+x_4=0.$$
	%$$\left\{\left\{x\to -\left(-\text{px}^2-q\right)^{1/4}\right\},\left\{x\to -i \left(-\text{px}^2-q\right)^{1/4}\right\},\left\{x\to i \left(-\text{px}^2-q\right)^{1/4}\right\},\left\{x\to \left(-\text{px}^2-q\right)^{1/4}\right\}\right\}$$
	
	而这些关系式系数在$R_0$中。本例给定方程是四次的，因而存在根有24个可能置换，他们可以构成一个24阶置换群，记作$S$，其中有且仅有下列8个置换。
	\[
	E=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_1,x_2,x_3,x_4
	\end{pmatrix}
	E_1=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_2,x_1,x_3,x_4
	\end{pmatrix}
	\]
	\[
	E_2=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_1,x_2,x_4,x_3
	\end{pmatrix}
	E_3=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_2,x_1,x_4,x_3
	\end{pmatrix}
	\]
	\[
	E_4=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_3,x_4,x_1,x_2
	\end{pmatrix}
	E_5=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_4,x_3,x_1,x_2
	\end{pmatrix}
	\]
	\[
	E_6=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_3,x_4,x_2,x_1
	\end{pmatrix}
	E_7=\begin{pmatrix}
	x_1,x_2,x_3,x_4\\
	x_4,x_3,x_2,x_1
	\end{pmatrix}
	\]
	使得上述系数在$R_0$中两个关系式中保持不变。这八个置换群构成群$S$子群，记作$H_0$，$H_0$称为给定方程相对于域$R_0$群。也就是说，一个方程相对于域$R_0$群是根置换群或子群，这个群中置换使给定方程根之间带有$R_0$中的系数全部关系不变。$H_0$中置换数目是我们对根无知程度的一个尺度，因为在这8个置换下我们不能区分它们，所以$H_0$阶实际上表示根不可区分程度。为解出各个根$x_k$，我们必须对它们加以区分。
	
	现在考虑$x_1^2-x_3^2$，它等于$\sqrt{p^2-4q}$。添加这个根式到$R_0$中，形成一个域$R_1$，即形成包含$R_0$和$\sqrt{p^2-4q}$最小域，于是
	\[x_1^2-x_3^2=\sqrt{p^2-4q}\]
	是$R_0$中一个关系。考虑到$x_1^2=x_2^2$和$x_3^2=x_4^2$（因为$x_1+x_2=0$和$x_3+x_4=0$），我们可以看出，群$H_0$中前四个置换使$R_1$中这个关系保持不变，后四个不可以。这前四个置换构成$H_0$一个最大不变子群，记为$H_1$。$H_1$就是方程相对于$R_1$的群。
	
	现设我们添加量$\sqrt{(-p-D)/2}$到$R_1$中（这里，$D=\sqrt{p^2-4q}$），并形成域$R_2$，则
	\[x_3-x_4=2\sqrt{\frac{-p-D}{2}}\]
	是$R_2$其中一个关系。这个关系仅在头两个置换$E$和$E_1$下保持不变，其余六个置换不这样。这两个置换构成$H_1$的一个最大不变子群，记为$H_2$，$H_2$就是方程相对于$R_2$的群。
	
	假设添加量$\sqrt{(-p+D)/2}$到$R_2$中，得到域$R_3$。在$R_3$中我们有
	\[x_1-x_2=2\sqrt{\frac{-p+d}{2}}\]
	现在恰有置换$E$能够使$R_3$中全部关系保持正确，构成单元素群$H_3$。$H_3$是$H_2$最大不变子群。是方程相对于$R_3$的群。
	
	伽罗瓦证明当方程相对于某个域群恰好只含有恒等置换$E$时，这个域就是该方程根域（包含方程所有根最小域）。因此，$R_3$是给定方程根域。就是说，用这个域中元素足以把方程诸根明确表示出来。
	
	一个方程可否用根式求解，与根域性质密切相关。如果从系数域到根域扩域过程中每次添加都是根式，则方程可用根式解，否则，方程不能用根式解。上述三次扩域都是添加根式，d都取自原方程根表达式中。对于一般高次方程，需要在不知道根情况下判断它是否可用根式求解。为确定扩域过程中的添加项，伽罗瓦也使用预解式概念，给出构造预解式方法。仍旧讨论原方程。根据伽罗瓦的方法，为扩充域$R_0$，需要在$R_0$中构造一个方程，叫作原方程部分预解式。预解式就是$t^2-(p^2-4q)=0$，次数等于子群$H_1$在母群$H_0$中的指数（母群阶被子群阶相除所得商）$8\div4=2$。这个预解式根，例如$\varphi_1=\sqrt{p^2-4q}$就是为扩充域$R_0$所需添加项，在域$R_1$中构造方程预解式
	\[t^2-2(-p-\sqrt{p^2-4q})=0\]
	它的次数等于子群$H_2$在母群$H_1$中指数$4\div2=2$，解这个预解式，取根
	\[\varphi_2=\sqrt{2(-p-\sqrt{p^2-4q})}\]
	为扩充域$R_1$所要添加项。同理，在$R_2$中作预解式
	\[t^2-2(-p+\sqrt{p^2-4q})=0\]
	它的次数等于$H_3$在$H_2$中指数$2\div1=2$，解得
	\[\varphi_3=\sqrt{2(-p+\sqrt{p^2-4q})}\]
	就是扩张域$R_2$所添加项。根据伽罗瓦理论，上述步骤对于一般代数方程是可行的。扩域过程中任意一个预解式都是二项方程
	\[x^k-A=0\text{（$k$是质数）}\]
	则预解式可用根式解，从系数域到根域扩张过程所添加的都是根式，方程便是可用根式求解的。反之，如果一个方程可用根式求解，则预解式方程组必定存在，并且都是次数为素数的二次方程。
	
	上述讨论涉及两根序列。一个是扩域序列
	\[R_0\subset R_1\subset R_2\subset R_3\]
	一个是最大不变子群序列
	\[H_0\supset H_1\supset H_2\supset H_3\]
	其中$H_i$是方程相对于域$R_i$群。后一个序列又叫合成序列。对于一个给定方程，寻找相对于系数域群以及最大不变子群序列，纯粹属于群论讨论范围，是可以做到的。有这个子群序列，子群$H_{i+1}$在母群$H_i$中指数随之确定。伽罗瓦得到一个重要准则（伽罗瓦基本定理），如果这些指数都是素数，则方程可用根式求解，若这些指数不全是素数，则方程不可用根式求解。这样，方程可解性问题这一历史难题，可完全用群论方法解决。
	
	伽罗瓦引用一系列新名词、新符号，但是他理论太艰深，远远超过时代，的确“使读者感到反感”，他的论文时而被数学大师“遗失”，时而被数学大师认为“难以理解”，直到他死后多年，才被人们理解和接受\footnote{他的朋友Chevalier遵照伽罗瓦的遗愿，将他的数学论文寄给高斯与雅各比，但是都石沉大海，要一直到1843年，才由刘维尔肯定伽罗瓦结果之正确、独创与深邃，并在1846年将它发表。}。
	
	伽罗瓦引用大量新词汇和新符号是“因为题目重要性”，是值得的。他为人类数学发展作出杰出贡献。解决了困扰人类多年数学的问题（“三等分任意角”和“倍立方问题”）。更为重要的是，通过方程可解性问题，提出全新数学概念，开辟出新数学研究领域，对近代数学形成发展产生巨大影响。
	
	如果没有多大必要性引入过多符号，就是“丑陋的”。正如模棣尔说：丑陋的数学是“使用大量变量、常数和上、下、左与右标，使人们难以掌握结果含义，他显然只是为自身需要进行推广，所得结果也毫无新颖之处，另外还有一些工作，结果没有显著重要性，因此，也不应该在理解和验证方式上给读者增加负担”。
	\chapter{问题解决中符号处理技巧}\label{cha:cha51}
	符号学为人们提供一个新的了解、分析研究问题的思维方法。人类几乎处处都要运用符号处理技术。利用计算机解决问题，要对问题作符号处理，利用电报传递信息需要对电文作符号处理……，在数学中表现尤为突出，我们知道，韦达引入符号促进代数学成为独立学科，莱布尼茨使用符号创立微积分，伽罗瓦使用符号创立群论……现代，“符号处理”已成为“问题解决”过程中一个重要方法。
	\section{问题与“问题解决”}
	许多自然科学家、心理学家认为，科学研究与创造是“从提出问题开始的”。爱因斯坦曾明确说过，提出一个问题往往比解决一个问题更重要。英国科学家波普把科学发现逻辑表述为“$P_1\to TT\to EE \to P_2$”，即“问题1$\to$试探性讨论$\to$消除错误$\to$问题2”这样一个图式，认为“科学只能发端于问题”。苏联心理学家鲁宾斯坦也早说过：“思维起源于问题的情景”，“是从分析问题情景开始的”。
	\subsection{数学问题和数学发展}
	什么是问题呢？心理学家认为，所谓问题实际上就是出现“没有加以确定的环节或要求的场景，这种情景是以其中揭示出某种东西为前提的”。问题与习题有区别，例如，解对数问题对高中学生不是问题，但初中生就是问题。一般说来，一个“情景”可以产生一个问题，也可以不产生什么问题。一个情景的要求，倘若毫无困难地通过一些明显的行动就达到了所求的目标，那就不产生问题。然而，倘若谁想不出这样的行动来，那就产生问题。人们在日常生活、科学活动中经常会发现问题。
	
	美国数学家哈尔莫斯曾指出：定理、证明、概念、定义、理论、公式、方法中的任何一个都不是数学的心脏，只有问题是数学的心脏，数学科学的起源和发展是由问题引起的。古人结绳计数是为了解决生产和生活用品的多少问题。我们秦汉时期的数学著作，《周髀算经》和《九章算术》就是当时的数学家解决数学应用问题成果的汇集。几何学萌芽于古埃及，那是从解决尼罗河流域的土地测量问题而产生，后来经过古希腊过滤， 发展起来的。诸如自古相传的立方倍积问题、化圆为方问题、三等分角问题；数值方程的解、曲线论、微积分、傅里叶级数和位势理论中那些最初的问題；还有大量属于力学、天文和物理学方面的问题等等，都刺激、推动了数学的发展。
	
	自希尔伯特1900年在巴黎会议上发表讲演《数学问题》以来，数学问题对于数学发展的重要意义已经得到公认。正如希尔伯特所说：“某类问题对于一般数学进展的深远意义以及它们在研究者个人的工作中所起的重要作用是不可否认的。只要一门科学分支能提出大量的问题，它就充满着生命力；而问题缺乏则预示着独立发展的衰亡或中止。”历史事实表明，通过提出问题会导致产生新学科。希尔伯特举出三个典型例子。第一，贝努利最速下降线问题是现代数学分支--变分法的起源。第二，费马问题，它看上去“非常特殊，似乎不十分重要”，却对科学产生了令人鼓舞的影响。现代数论中的核心槪念“理想数”正是为解决费马问题而提出的，而且其意义已远远超出数论的范围而深入到代数和函数论的领域，第三， 三体问题，它对现代天体力学起了关键作用。
	
	当然，类似的例子还有不少。例如，分赌注问题与概率论， 七桥问题与拓扑等。
	
	希尔伯特悟得一条真理，重大的个别问题是数学的活的血液。为了说明某些问题的重要性，希尔伯特还在《数学问题》讲演中提到了维尔斯待拉斯：“维尔斯特拉斯认为他的极大的幸运是在其科学事业之初，就找到了像雅可比逆问题这样一个重要的、可供研究的问题。”
	
	希尔伯特的演讲《数学问题》是世界数学史上的重要里程碑。
	
	希尔伯特高瞻远瞩地用23个数学问题，预示20世纪数学发展进程。巴黎会议之后，各国数学杂志纷纷转载他的演说稿， 大批数学家投入到解决“23个问题”的激流中去。1900年希尔伯特高足，麦克思•戴恩获得笫一个重要结果。他证明（正如希尔伯特所猜想）一个正四面体不可能被剖分后再拼合成一个等体积立方体。等于同时希尔伯特第3问题部分解答。次年，戴恩究全地证明了第3问题--两个等底等高四面体体积相等问题。其大意是：存在两个等底等高四面体，它们不可能分解为有限个四面体，使这两组四面体彼此全等。戴恩证明确实存在这样的两个四面体。后来， 他被称为“荣誉等级”的数学家行列中的第—名数学家。
	
	现在，时光已过去100多年，“23个问问题”约有一半已获得解决\footnote{实际上大部分均已解决，详细解决情况请参考维基百科相关链接。}，有一些取得了很大进展，有些则收效甚微。1975年，在美国的伊利诺斯大学召开了一次国际数学会议， 遨请进界著名数学家参加，专门研究 “23 个问题” 的进展。会后出版论文集详细介绍了各个问题的进展 。80年代以来，人们把解决希尔伯特问题，那怕是其中一部分，都看成至高无上的荣誉。据统计，从1936年到 1974年，菲尔茨国际数学奖的20名获奖人员中，至少有12人的工作与希尔伯特问题有关。1976年，美国数学会组织评论1940年以来的美国十大数学成就，其中有3项是希尔伯特问题的解决。我国数学家陈景润在希尔伯特第8问题（素数问题）上取得了世界领先地位，在第16问题上也作出过—些贡献。
	
	大数学家韦尔在希尔伯特去世时悼词中曾说过：“希尔伯特就像穿杂色衣服的风笛手，他那甜蜜的笛声诱惑了如此众多的老鼠，跟着他跳进了数学的深河。”希尔伯特提出“23个问题”之后，果然产生许多新数学分支，达到了他预期的目的。
	
	数学问题与数学发展之间的密切关系，由此可见一斑。
	
	\subsection{“问题解决”}
	日本心理学家大桥正夫曾讲过，思维是“解决问题的过程”。问题的解决是一种高级形式的智力活动。是指人们在社会实践和理论学习中，面临新情景、新课题，而没有现成对策、答案或解决方案时，所引起的寻求处理问题的一种紧张的心理活动。这种心理活动，具有某种程度的创造性。
	
	由于问题性质不同以及主体思维方式相异，因此问题解决的心理过程是多种多样的。不可能用一个统一的模式来解释如此复杂多样的智力活动过程，许多心理学家和教育家从不同的角度对之进行了描述，企图将问题解决的过程清晰地呈现出来。在这方面，1945年波里亚《怎样解题》一书被誉为一面“问题解决”的旗帜。波里亚认为，面对问题，解决它， 就“定味着发现一条摆脱疑难、绕过障碍的途径，以达到一个不能一蹴而就的目的”，为此需要动员和组织已有的知识、技巧，“它是人类最富有特征的智力活动”。《怎样解题》中心思想就是谈问题解决过程中怎样诱发灵感。其中“怎样解题”表实质上就是试图用以诱发灵感的“皆力活动”表。“表”中包含四部分内容：弄清问题；拟定计划；实现计划；回顾。 波里亚写道，“了解问题是为了好念头的出现作准备；制订计划是试图引发它；在引发之后，我们实现它；回顾此过程和求解结果，是试图更好的利用它。”其中的所谓好念头就是指数学灵感。
	
	在数学学科中，能力指的是什么？ 波里亚说：“这就是解决问题的才智--我们这里所指的问题，不仅仅是寻常的， 它们还要求人们具有某种程度的独立见解、判断力、能动性和创造精神。”因此，他提出：“中学数学教学首要任务就是加强解题的训练。”
	
	波里亚发现，在日常解题和为攻克难关而作出的数学中的重大发现之间，并没有不可逾越的鸿沟。他写道：
	
	“一个重大的发现可以解决一个重大的问题，但在求解任何问题的过程中，也都含有点滴的发现。”
	
	“一个有意义的题目的求解，为解此题所花的努力和由此得到的见解，可以打开通向一门新科学，甚至通向一个科学新纪元的门户。”
	
	波里亚认为，要想作出重大的数学发现，就必须重视平时的解题，因为平时的解题和数学发现之间，只有难易程度上的差别，在本质上是完全一样的。
	
	波里亚的"解题"不同于通常人们所指责的“题海战术”。他认为，一个数学教师，如果“把分配给他的时间塞满了例行运算来训练他的学生，他就扼杀了学生的兴趣，妨碍了他们的智力发展……”因此他主张，与其穷于应付繁琐的数学内容和过量的题目，还不如选择一个有意义的但又不太复杂的题目，去帮助学生深入发掘题目的各个侧面，使学生通过这道题目，就如同通过一道大门而进入一个崭新的天地。比如，证明“$\sqrt{2}$是无理数”与“素数有无限多个”就是这样的好题目，前者指向实数精确的槪念,而后者是通向数论的门户。 打开数学发现大门的金钥匙往往就在这类题目之中。
	
	众所周知，数学有两个侧面，一方面，已严格提出来的数学是一门系统的演译科学，另一方面，在创造过程中的数学看来却像一门实验性的归纳科学。波里亚指出，通过研究解题的方法，我们可以看到数学的第二个侧面，也就是看到“处于发现过程中的数学”。这对于提高创造能力是有益的。
	
	《怎样解题》已经译成16种文字发行100多万册或更多，成为世界名著。著名现代数学家瓦尔登在1952年2月2日在瑞士苏黎世大学会议致词中就曾说过：“每个大学生、每个学者，特别是每个教师都应该读这本引人入胜的书”。对这本书给予极高的评价，今天，人们已公认，在“问题解决”的研究方面，波里亚作出了划时代的贡献。
	
	波里亚把“解题”作为培养学生的数学才能，教会他们学会思考的一种手段和途径。这种思想得到了国际教育界的广泛赞同，1976年国际数学管理者委员会把解题能力列为十项基本技能的首位。 1980年，美国数学教师全国委员会“行动纲领”建议把“问题解决作为80年代学校数学的核心”，这是继“新数学运动”和“回到基础”之后的又一新口号。“问题解决”已成为美国数学教育工作者的目标，而波里亚则成为 “问题解决”的带头人。目前，以“问题解决”为中心的课程改革，正在世界许多国家探讨、研究。人们普遍认为，这种“问题解决”的数学课程，有利于锻炼学生解决问题的能力，有利于培养现代社会所需要的，具有创造能力的人才，这种数学课 程，只要再注意到数学知识的系统学习，就能比较符合社会结构、数学知识结构和学生心理结构发展的要求。
	\section{几何图示法}
	笛卡尔曾说过，“没有任何东西比几何图形更容易印入脑际了，因此用这种方式来表达事物是非常有益的。”波里亚正是用几何中的线来表示思维过程中推理的线索而得到了“解题过程的几何图示法”，这种几何图示法就是一种利用符号处理问题的方法。
	
	波里亚回忆说，在他读大学的时候帮一个男孩子复习功课，被一条立体几何题“卡住了”，“居然对付不了这样一道简单的题目，我只能责怪自己。第二天晚上我坐下来重新从头到尾仔细去解它，那次我是做得这样彻底，以致这辈子再也不会忘记它了。由于试图直观地去看淸楚整个解题的自然过程和解题中涉及的一系列基本想法，我终于得到了一个解题过程的几何图示法。”波里亚写道:“这是我对解题的第一个发现，也是我终生对解题产生兴趣的开端”。
	
	发现解法，就是在原先是隔开的事物或想法（已有的亊物和要求的事物，已知量和未知量，假设和结论）之间去找出联系。被联系的事物原来离得越远，联系的发现者的功绩也就越大，这种联系就像一座桥，一个伟大的发现使我们强烈地觉得像是在两个离得很远的想法的鸿沟上方架上了桥。我们常常看到这种联系是由一条链来贯穿的；一个证明像是一串论据，像是一条由一系列结论组成的链，也许是一条长链。对于思维上的联系人们经常使用的词是线索，将一条细微的线索当成一条几何上的线，将被联系着的事物当成几何上的点，这样无可避免地，一幅隐喻着一系列数学结论的图式便必然地浮现出来了。
	
	波里亚选择了一个非常简单的立体几何题，来阐明他的方法，并把一系列引导到它的证明的想法重新整理出来。他“缓慢地，非常缓慢地去作，逐个地把线索揭示出来”。从中我们可以看出他是怎样随着他的思想的发展而逐步引入符号的。
	
	问题：给定正棱台的高$h$，上底与下底分别是边长为$a$与$b$的正方形，求正棱台的体积$V$。
	
	\subsection{明确问题与目标，并用符号表示}
	先集中到目标上，并尽可能明确地画出所求的体积的图形，请看图\ref{fig:p51}，所求目标在思维中的位置则用一个单点，象征性地表示出来，我们的全部注意力应该集中在它上面。
	\begin{figure}\label{fig:p51}
		\centering
		\includegraphics[scale=0.15]{Usech_kvadrat_piramid.png}
		\caption{棱台}
	\end{figure}
	我们问自己，已知量是什么？这样，我们把注意力集中到图中已知线段$a$、$b$和$h$。
	\subsection{转化问题，引入新符号}
	当我们不能解决新问题时，总是设法寻找一个适当的关联问题。眼下，情况比较简单，未知量是什么？一个棱台体积。这个棱台是棱锥整体截取一个较小棱锥剩余部分。大棱锥底面积是$b^2$。我们知道大棱锥体积$B$和小棱锥体积$A$，也就知道棱台体积$V=B-A$。
	
	如果你不能解出所出问题，那就去寻找一个……
	
	也许是个好主意！
	
	我们原问题求$V$，现在转化为两个适量关联问题--求$A$和$B$。下面任务是求两个新未知量$A$和$B$。
	\subsection{进一步发展}
	我们要求找出未知量$A$和$B$。未知量$A$是什么？一个棱锥体积。我们有两个已知量，底面积和棱锥高，大棱锥体积就可以计算出来。不过这里没有给出，不过我们还是可以考虑进来，设为$x$，则
	\[A=\frac{a^2x}{3}\]
	未知量$A$和$B$有类似性质。根据棱锥体积公式$A$，则小棱锥体积公式
	\[B=\frac{b^2(x+h)}{3}\]
	剩下未知量是什么？是$x$--一条线段长。
	
	几何中三角形很常见，如果有可能就从一个直角三角形。或是1对相似三角形中得到一条线段长，然而图形中没有一个可以使用的三角形，例子中应该存在一个直角三角形，以$x$为边。这样一个三角形应该在一个同时在大棱锥和小棱锥高的平面上，两个棱锥具有相似性，是的，我们找到两个相似三角形，这就是我们想要寻找的，因此很容易得出公式：
	\[
	\frac{x}{x+a}{a}{b}
	\]
	公式简单变形化简，可以用已知量$a$、$b$和$c$表示出$x$。
	\section{彻底完成它}
	问题解决了吗？我们应该用已知量$a$、$b$和$h$表示出棱台体积$V$。这一点我们还尚未完成。但是我们工作最引人注目的部分已经过去，剩下部分只需要按部就班走下去，不需要拐什么弯了。
	
	上述工作中是有冒险因素的。每一个阶段我们都希望离目标更近--架起一道桥梁。当然，我们希望如此，但是我们并没有十足把握。每一个阶段我们都需要想出下一步并冒险尝试。但现在，我们不需要冒险和尝试，我们已经找到方法。
	
	首先处理未知量$x$，得
	\[x=\frac{ah}{b-a}\]
	把$x$代入未知量$A和$$B$中得
	\[A=\frac{a^3h}{3(b-a)}\]
	\[B=\frac{b^3h}{3(b-a)}\]
	结果很令人满意，完全符合我们得直觉，我们得到等式
	\[V=B-A=\frac{b^3-a^3}{b-a}\cdot\frac{h}{3}=\frac{(a^2+ab+b^2)h}{3}\]
	这就是我们要求得表达式。
	\section{心智图象}
	心智图象是“问题解决”过程中深层次的符号。
	
	心智图象是具有某种程度抽象化、模式化的模糊“形象”，又称为“心理意象”、“智力图象”。心智图不仅是一般意义上的具体图形，而是一种形式化的抽象，但是，又与词语抽象不同，与代数抽象不同，还保留某种图象。例如，把一条奔腾咆哮的大江抽象为一条曲线（不是抽象为江这个“词”）。把两个有公共元素的学生集合抽象为两个相交圆。欧拉为向一个瑞典王子解释演绎的特性，就用圆代表一般的概念。让我们考虑$A$和$B$两类事物，如果“凡是$A$都是$B$”，则我们就想象圆$A$位于圆$B$内。而如果“没有$A$是$B$”，我们就想象圆$A$和圆$B$完全不相交。如果“某些$A$是$B$”，则想象为圆$A$和圆$B$相交。
	
	{\heiti 例}\quad 有41名学生数理化三科竞赛，其中不及格人数为
	
	\begin{center}
		\begin{tabular}{c|c|c|c|c|c|c}
			\hline
			% after \\: \hline or \cline{col1-col2} \cline{col3-col4} ...
			数学&物理&化学&数理&数化&理化&数理化\\ \hline
			12&5&3&2&6&3&1\\
			\hline
		\end{tabular}
	\end{center}
	
	试问有多少同学3科都及格？
	
	如图，不妨先画出两两相交并有公共部分三个圆，再根据表格数据，分别填好。因为总人数为41人，显然，三科都及格人数为$41-15=26$人。
	
	借助于心智图，可以解决本题。
	
	构造心智图是对问题进行符号化处理的有效办法。正如笛卡尔说：“在推理解决问题时，心智图作用是首要的。”波里亚几何图示法实际上就是构造心智图。
	\subsection{心智图象整体识别功能}
	心智图象具有综合特点，利用心智图象便于从整体上进行直觉识别。
	
	美国学者西蒙曾进行一个实验：在棋手面前放置某次高水平比赛棋谱（含有25个棋子）展示10秒，如果是国际象棋大师，则能够准确复述棋谱；普通棋手能够记住6个棋子摆放位置。倘若同样数量棋子随意放置在棋盘上，象棋大师和普通棋手能够记起摆放位置棋子数量均为6个。造成这种情况原因是，大师具有整体思维，建立某种心智图象--一个具有内在联系棋谱。注视棋盘10秒钟使他把储存于大脑中心智图完整取出，而不是一个或几个棋子的记忆。一旦遇到杂乱无章的棋子，他就搜索不到已有心智图，长期形成的模式不起作用，只能够和新手一样死记。
	
	这种从整体上构造心智图象能力是现代计算机所缺乏的。十年前，美国最好的计算机棋手Belle与世界冠军相比，评分为$1.90:2.70$，相差甚远。尤其是残局时，Belle能力尤低，因为机器人长于逻辑运算，缺点在于缺乏全局思考能力，人则擅长于判断形势，借助于心智图象从整体上进行综合判断。
	
	笛卡尔高度重视心智图象在数学推理中的整体把握作用，他说“在把推理过程结果一一罗列后，就需要记住它们，而记忆可以帮助我们把那些暂时不用的资料贮存起来。但这些被考虑的资料既不按心智图象的方式经常在脑海中出现，又不将它们在各个例子中奉献出来，那么，这些资料就有被遗忘的风险。”事实上，为从整体上把握研究对象和方向，许多科学家都有构建心智图象习惯。希尔伯特多维空间不是现实空间，是思维所构想的心智图象空间。爱因斯坦相对论四维空间、原子物理学理论中“玻尔轨道”、“电子壳层”、“电子云”等等都是一种具有某种抽象性的心智图象模型。并非有形象性的“轨道”、“云”之类的东西。
	\subsection{关于“素数有无限个”的证明}
	关于素数，历史上产生一个问题是：“素数是有有限个还是无限个？”欧几里德首先证明：“素数个数是无限多的”。是一个算术基本而著名的定理。
	
	欧几里德没有拘泥于素数细节特征而是从整体上把握问题研究方向和内容：如果素数整体上是有限个，能不能推导出矛盾，设有最大素数$P$，则$2\times3\times5\cdots\times P+1$是素数还是合数？……这是导致成功的方向。
	
	阿达玛依依次列出这个经典证明每个步骤，同时描述他在“读到这个证明每一步时心智图象”，（假设我们要证明存在比11大素数）：
	
	\begin{center}
		\begin{tabular}{c|c}
			\hline
			% after \\: \hline or \cline{col1-col2} \cline{col3-col4} ...
			证明步骤                                                                      & 心智图象                                                     \\   \hline
			考虑所有位于从1到11质数，即2，3，5，7，11& 看到一些杂乱无章的数字                           \\
			作乘积$2\times3\times5\times7\times11$。               & $Q$是一个大数，远离那些杂乱无章的数 \\
			在结果上+1                                                             & 我看到第二个点，稍微远离第一个点        \\
			此数不是素数，必定能被素数整除，这个素数就是所求数 & 我在一堆数字和第一个点看到一个位置   \\
			\hline
		\end{tabular}
	\end{center}
	
	利用智力图象便于从整体上把握研究对象和方向，是一种有效的有效的符号法。阿达玛说，他所从事的全部数学研究中，他都会构作心智图象。
	\section{符号处理技巧举例}
	几乎每个数学分支都有一套符号处理技巧。对于一些特殊问题，除构作心智图象外，往往还需要一些特殊符号处理技巧。本节中，我们将通过一些典型事例来进一步阐明“问题解决”过程中符号处理技巧。其中，有些例子完全可以用某些现代数学原理解决，不过，为了揭示符号处理技巧，欣赏“处于发行过程中的数学”，我们撇开现成的原理，而引用符号解决问题。
	\subsection{哥尼斯堡七桥问题}
	哥尼斯堡七桥问题是数学史上著名问题，几乎每一本数学方法论都会提及到，我们也要说到它。
	
	布勒格尔河流经哥尼斯堡市区，河中有两个小岛，如图\ref{p4}，小岛与河岸共有七座桥梁。
	\begin{figure}[htbp]
		\centering
		\includegraphics[scale=0.75]{ge1}
		\includegraphics[scale=0.99]{ge2}
		\caption{哥尼斯堡七桥问题}\label{p4}
	\end{figure}
	长期以来，人们一直在思考一个问题：一个游人能不能不重复且不遗漏的走遍七座桥回到原始出发地？欧拉在1736年解决这个问题，并在彼得堡科学院作报告。
	
	欧拉看出小岛、	河岸大小、形状和桥梁长度问题都无关紧要，相互连接关系才是问题实质。因此，他把小岛和两岸都用符号点表示。连接河岸和小岛桥梁也用符号线表示（如图\ref{p4}），心智图象画成什么样子是次要的，只要不改变元素之间的关系。为此，通过一座桥就可以画出一条直弧线，不重复通过七座桥梁就是画七条弧线所组成的图形。问题转化为“一笔画”问题。
	
	欧拉考虑到“一笔画”结构问题。一笔画有起点和终点，除起点和终点外，一笔画中可能出现一些曲线交点，这些交点处通过曲线一进一出，总是偶数条，可以称为“偶点”，起点和终点通过曲线为奇数条，称为“奇点”。任何一个一笔画图形或者没有奇点，或者有两个奇点。图形中四个点为奇点，超过一笔画范围，不能一笔画范围，意味着“七桥”不可能一次无重复走完。
	
	欧拉解决这个问题关键在于抽象思维，揭示问题实质并对问题进行符号处理。这项研究对几何学发展有重要作用。正如欧拉在科学报告中所说：
	
	“讨论长短大小的几何分支一直被人热心研究着，但是，至今还有一个完全没有被探索过的分支，莱布尼茨首先提起过，叫做‘位置几何学’，这个几何分支只讨论与位置有关的关系，只研究位置的性质，不去考虑长短大小，也不牵涉到计算量。但时至今日，还没有令人满意的定义，用来刻划这门位置几何学课题与方法，近来流传一个问题，虽然无疑问属于几何学，但是不是用求尺寸、计算量解答，所以我毫不犹豫将其归入位置几何学，特别是它只要考虑位置，不用计算。这里我要谈一谈我所发现解这类问题的方法，可以作为位置几何学的一个例子”。
	
	其中所说问题就是上述七桥问题，事实上，欧拉的研究最终导致图论这个数学分支的诞生。
	\subsection{拉姆齐问题}
	1947年，一次匈牙利数学竞赛出现一道题目：
	
	证明：任何6个人，总有三个人互相认识或互不认识。
	
	问题一出现，立即引起各国从事数学竞赛数教育学家和组合数学（特别是图论）数学专家注意。1953年，	在美国普特南数学竞赛出现，1955年，加拿大著名组合数学专家格林伍德和格里逊专门撰写论文，对题目作出推广，1958年，美国著名数学杂志《美国数学月刊》刊登题目并广泛征求解答。此后，这个题目推广被各种竞赛用作试题。
	
	为证明本问题，我们先对问题进行符号处理。把6个人抽象为平面上6个点，记作$A_1$、$A_2$、$A_3$、$A_4$、$A_5$、$A_6$。把互相认识关系转化为两点间直线表示，不认识用虚线表示。以$A_1$为起点，其余5点可以连接5条直线，依据抽屉原理，至少有3条线为实线或虚线，不妨设为实线（即互相不认识），它们分别为$A_1A_2$、$A_1A_3$、$A_1A_4$。考虑$\Delta A_1A_3A_4$，三边都为虚线，结论成立。三条线段至少有一条为实线，不妨设为$A_1A_3$，则$\Delta A_1A_2A_3$为同类，结论任然成立。
	
	问题引起如此广泛重视，有其深刻原因。
	
	17个科学家每个人都和其他人通信，但通信中仅仅讨论三个问题。证明其中至少3个科学家，同时讨论1个问题。
	
	证明方法和上例类似。
	
	科学家用点$A_1,A_2,A_3,\cdots,A_{16}$表示，科学家互相联系为两点间线段。为区分不同题目，还必须对这些线段附加不同标志，这时，因为有三个题目，虚线和实线已经不足以区分，我们用涂色方法加以区别，讨论第一题用红色，第二题为黄色，第三题为蓝色。
	
	自$A_0$引出线段16条，根据抽屉原理，其中有6条或更多是同一个颜色的。不妨设$A_0A_1,A_0A_2,A_0A_3，\cdots,A_0A_{6}$为红色。
	
	考虑自$A_1$引出5条线段$A_1A_2,A_1A_3,A_1A_4,A_1A_5,A_1A_6$。如果5条中有1条，比如$A_1A_2$是红色的，那么$A_0A_1,A_0A_2,A_1A_2$都是红色的，也就是$A_0,A_1,A_2$三人讨论同一个问题。
	
	如果5条线段都不是红色的，其中必有3条同色，不妨假设$A_1A_2,A_1A_3,A_1A_4$是黄色。如果$A_2A_3,A_3A_4,A_2A_4$中有一条为红色，那么与$A_0$引出两条红线组成一个红色三角形；其中一条为黄色，那么与$A_1$引出两条黄色线段组成黄色三角形；如果三条全部为蓝色，那么$\Delta A_2A_3A_4$就是蓝色三角形，结论成立。
	
	“涂色”已成为符号处理技术中一条典型方法。这种讨论一个图中是否存在同色三角形（或其他同色三角形）的问题在图论中被称为拉姆齐问题。问题内容极其丰富。
	
	下面是一个讨论图中是否存在同色矩形例子：
	
	设$n$为自然数，不大于44。证明对每个定义在$N^2$上，值在集\{$1,2,\cdots,n$\}中函数$f$，存在四个有序数对$(i,j),(i,k),(l,j),(l,k)$，	满足
	\[f(i,j)=f(i,k)=f(l,j)=f(l,k)\]
	其中$i,j,k,l$均为自然数，存在自然数$m,p$，使
	\[1989m\geqslant i<l<1989+1989m\]
	\[1989p\geqslant j<k<1989+1989p\]
	（第30届国际数学竞赛预选题，古巴提供）
	
	{\heiti 分析}\quad 将函数值为$t(1\geqslant t\geqslant n)$点染上第$t$种颜色。问题即将正方形
	\[\{(x,y)\mid 1989m\geqslant x<1989(m+1)\}\]
	\[1989p\geqslant y<1989(p+1)\]
	中整点染色，证明在颜色种数$\geqslant44$时，必存在一个边与坐标轴平行矩形，其四个顶点为同一个颜色。
	
	由于正方形有$1989^2$个整点，因而至少有$\dfrac{1989^2}{44}+1=q$个点涂同一个颜色。所以只需要证明将正方形中$q$个点染上红色时，必有一个顶点为红色矩形，边平行于坐标轴。
	
	设第$i$列有$a_i$个点染上红色，则
	\[\sum_{i=1}^{1989}a_i=q=\frac{1989^2}{44}+1\]
	在第$i$列，有$a_{a_i}^2$对点，每一对由两个红点组成。如果
	\[\sum_{i=1}^{1989}C_{a_i}^2>C_{1989}^2 \]
	那么必有两列，两列必有一对红点在相同两行上，也就是四点构成一个矩形。
	
	由柯西不等式
	\begin{equation}
	\begin{split}
	\sum_{i=1}^{1989}C_{a_i}^2&=\frac{1}{2}\sum_{i=1}^{1989}(a_i^2-a_i)=\frac{1}{2}(\sum_{i=1}^{1989}a_i^2-q) \\
	&\geqslant\frac{1}{2}(\frac{(\sum_{i=1}^{1989}a_i)^2}{1989}-q)=\frac{1}{2}(\frac{q^2}{1989}-q) \\
	&=\frac{q}{2\times1989}(q-1989) \\
	&\geqslant\frac{1989}{2\times44}(\frac{1989^2}{44}-1989)\\
	&=\frac{1989^2}{2\times44^2}\times1945 \\
	&>\frac{1989^2}{2}>C_{1989}^2.
	\end{split}
	\end{equation}
	因此，结论成立。
	\subsection{一类丢番图方程}
	对不定方程作出广泛研究的第一人是古希腊数学家丢番图。现在，人们把求整数解整数系数不定方程称为“丢番图方程”。丢番图没有给出不定方程一般解法，后世很多数学家作出很多努力。1900年，希尔伯特提出23个著名数学难题，其中第10个和丢番图方程有关，“是不是可以设计一种计算步骤，判定一个整数系数方程有没有整数解？”，答案是否定的\footnote{1970年苏联数学家马蒂塞维奇证明：在一般情况答案是否定的。}。
	
	这里只讨论一类特殊丢番图方程，例如：
	
	求方程$w+x+y+z=100$非负数整数解组数。
	
	我们例题中不定方程是一次方程，另外是求非负整数解组数。尽管如此，用普通解方程方法研究也是很麻烦的，我们需要设法进行符号处理。
	
	设$x=a,y=b,z=c,w=d$是方程一组非负整数解，因为$a,b,c,d$均为非负整数，我们可以写出等式：
	\[\underbrace{1+1+\cdots+1}_{a\text{个}}+\underbrace{1+1+\cdots+1}_{b+\mbox{个}}+\underbrace{1+1+\cdots+1}_{c\mbox{个}}+\underbrace{1+1+\cdots+1}_{d{个}}=100.\]
	可见，对于每一组非负整数解$x=a,y=b,z=c,w=d$，我们均可以构造如下一串符号
	\[\underbrace{1,1,\cdots,1}_{a\text{个}}\underbrace{1,1,\cdots,1}_{b\text{个}}\underbrace{1,1,\cdots,1}_{c\text{个}}\underbrace{1,1,\cdots,1}_{d\text{个}}\]
	与之对应，其中$a+b+c+d=100$，反之，一串符号也对应一组非负整数解。
	
	这个符号有什么特点？仔细观察和分析可以发现，这是在103个空位上，任选三位写0，其余位置上写1，原问题转化为“不尽相异元素排列问题”。
	
	因此，非负整数解组数为
	\[C_{103}^3=\frac{103!}{100!\times3!}=176851\]
	
	上述方法可以解一类计数问题。例如：
	
	高二年级8个班协商组成年级篮球队，需要10名队员，每班至少出1名队员，问有多少种组成方法。
	
	本题相当于如下不定方程
	\[x_1+x_2+\cdots+x_8=10\]
	不同正整数解$(x_1,x_2，\cdots,x_8)$组数。
	
	又等价于不定方程
	\[x_1+x_2+\cdots+x_8=2\]
	不同非负整数解$(x_1-1,x_2-1\cdots,x_8-1)$组数。
	
	上例所述方法共计可知有
	\[C_9^7=36\]
	种组合方式。
	
	本题当然有其他解答方法。例如将问题分为：“有1班出3人，其他各班出1人”，“有两个班出2人，其他班各出一人”等情况分步计算，相加计算结果。相比下，解答过程很繁琐。上述解法确实具有优越性。
	
	下面还有排列组合综合题：
	
	晚会上有6个演唱类节目和4个歌舞类节目，要求两个舞蹈类节目间至少有一个演唱节目，问共有多少种节目组合表？
	
	问题曾是高考题目，我们先考虑排列，再进行符号处理，6个演唱节目比喻为6个圆圈，4个演出节目比喻为4个竖线插入圆圈中间，竖线不能重复出现，只能用圆圈间隔起来。所以共有$C_7^4$种插法，考虑节目演出顺序，由乘法原理可知，共有
	\[\mathrm{C}_7^4\cdot \mathrm{P}_5^6\cdot \mathrm{P}_4^4=604800\]
	种不同节目顺序表。
	\subsection{利用函数符号解决问题}
	几十年前，克莱因领导德国数学教育改革运动在德国“引起一场大骚动”。运动所采取的口号是“用函数来思考”。改革者宣称，一般受教育者在数学课上应该学会重要事情用变量和函数来思考。改革者口号具有一定的道理，因为函数贯穿于数学理论和应用的每个场合。很多问题中，其他元素存在某种对应元素，发现这种对应元素，可以把原问题用数学语言表达出来，并借助于函数表达式或图像符号帮助解决。
	
	{\heiti 例}\quad 在$n$名选手循环赛中，每两人比赛一次（无平局）。证明以下情况有一种发生：
	
	（1）可以将每个选手分为两个非空集合，一个集合中任意一名选手战胜另一个集合中任意一名选手。
	
	（2）所有选手标上号码1至$n$，使得第$i$名选手战胜第$i+1$名选手，第$n$名战胜第1名。
	
	{\heiti 分析}\quad 先引用集合与函数符号，对问题进行处理。原问题等价于：
	
	对于有限集$x$每个元素有序对$(x,y)$，有一个数$f(x,y)=1\text{或}0$与之对应，且对所有$x,y(x\neq y),f(x,y)\neq f(y,x)$。证明以下两种情况恰好有一种出现：
	
	（1）$X$是两个不相交非空集合$U$$V$并集。对于任意$u\in U,v\in V$均有$f(u,v)=1$。
	
	（2）$X$元素可以标上$x_1,x_2,\cdots,x_ n$使得
	\[f(x_1,x_2)=f(x_2,x_3)=\cdots=f(x_{n-1},f_x)=f(x_n,x_1)=1.\]
	
	再用曲线符号代替函数符号。
	
	在f(x,y)=1时，画一条从$x$到$y$弧$x\to y$。在$f(x,y)=0$时（$f(y,x)=1$），画一条从$y$到$x$弧$y\to x$，产生一个有向图（按照原题说法，$x\to y$即选手$x$胜选手$y$）。
	
	（1）和（2）显然不可能同时存在（若2出现，则图成为一个圈，那么，从$v\in V$立即得出所有点属于$V$，（1）不能出现，只需要证明（1），（2）至少有一种出现。
	
	$n=2$时，（1）显然成立，在$n>3$时，设$x_1$胜利次数最多，若$x_1$胜所有选手，则（1）成立（取$U=\{x_1\}$）。否则设$y$胜$x_1$，被$x_1$战胜选手中必有$z$胜$y$（因为$x_1$胜利次数最多），图中有圆圈存在。
	
	设最长圈$x_1\to x_2\to \cdots \to x_m \to x_1(i \neq j\text{时},x_i\neq j)$。若$m=n$，（2）成立。我们设$m<n$。
	
	令$\mathrm{C}=\{x_1,x_2,\cdots,x_m\}$，对$y\in C$，或者每个$i$均有$x_i\to y$，或者每个$i$，均有$y\to x_i$。否则将有某个$i$，使$x_i\to y$而$y\to x_{i+1}$（约定$x_{n+1}=x_1$）,从而可以扩大为
	\[x_1\to x_2 \to \cdots x_i \to y\to x_{i+1} \to \cdots x_m \to x_1 \]
	出现矛盾。令
	\[A=y\in X/C:y\to x_i,i=1,2,\cdots,m\]
	\[B=y\in X/C:x_i\to y,i=1,2,\cdots,m\]
	则$A\cup B=X/C$，从而$A,B$至少有一项非空。
	
	对任何一对$a\in A,b\in B$。若有$b\to a$,令（若$B$非空）
	\[U=A\cup C,V=B.\]
	
	或令（若$A$非空）
	
	\[U=A,V=B\cup C.\]
	
	则（1）成立。
	\subsection{利用向量解决问题}
	向量概念源于一些物理量。有些物理量可用数值表示，例如质量、温度、密度、面积、体积等等，称作数量。还有一些物理量仅有数值大小还不够，要完全表示，还需要说明方向，例如力、速度、加速度等等属于此类，称为矢量或向量。1788年法国思想家拉格朗日在《分析数学》发表。书中，把某些物理量数学化，即用数学方法表示物理量。例如，他用有确定方向和长度线段表示力$f$，并沿坐标轴把力$f$分解为$f_x,f_y,f_z$。分力作为坐标轴上有向线段，可以简单用数表示。力学中关于力、速度、加速度所有方程，可以转化为联系它们的分量、关于$x,y,z$的三个方程。拉格朗日没有采用“向量”一词。
	
	拉格朗日以后，随着电学的发展，数学和物理学更加广泛研究这种有向线段的一般理论。到19世纪，德国数学家拉格斯曼引入有向线段，称作向量。
	
	向量在力学、物理学和技术中的重要性，构成解析几何一个重要部分--向量代数。名称是为区分分析方法研究向量理论--向量分析。后者是美国数学家吉布斯于1881-1884年建立的。
	
	下面我们选择一个初等问题，利用向量解决问题。
	
	{\heiti 例}\quad $A,B,C,D$位于半径为1球上，$AB\cdot BC\cdot CA\cdot DA\cdot DB\cdot DC=\dfrac{512}{27}$，证明$ABCD$是正四面体。
	
	{\heiti 分析}\quad 设球心为$O$，连接$OA,OB,OC,OD$，则需证明$OA,OB,OC,OD$四条线段两两夹角相等，与夹角概念紧密联系的就是方向问题，使我们联想到向量。
	
	记球心$O$到$A,B,C,D$向量为$\mid\vec{e_i} \mid=1$，且
	\[\prod _{1<i<j<4}\mid \vec{e_i}-\vec{e_j}\mid=\frac{512}{27}\]
	即
	\[(\frac{2^9}{3^3})^2=\prod_{1<i<j<4}(\vec{i}-\vec{j})^2=\prod_{1<i<j<4}(2-2\vec{e_i}\vec{e_j})\]
	约去$2^6$得	
	\begin{equation}\label{eq5}
	\frac{2^{12}}{3^6}=\prod_{1<i<j<4}(1\vec{e_i}\vec{e_j})
	\end{equation}
	由\ref{eq5}以及算术-几何平均不等式，得
	\[\frac{2^2}{3}\geqslant \prod_{1<i<j<4}(1-\vec{e_i}\vec{e_j})=1-\frac{1}{6} \prod_{1<i<j<4}\]
	即$$4+2 \prod_{1<i<j<4}\vec{e_i}\vec{e_j}\le0.$$
	$$\prod_{i=1}^4\vec{e_i}\leqslant 0$$
	\begin{equation}\label{eq6}
	\sum_{i=1}^4\vec{e_i}=0
	\end{equation}
	又有\ref{eq5}得
	\begin{equation}\label{eq7}
	\begin{split}
	\frac{2^8}{3^4}&=\sqrt[3]{\prod_{1<i<j<4}(1-\vec{e_i}\vec{e_j})^2}\\
	&=\prod_i\sqrt{\prod_{i=i}(1-\vec{e_i}\vec{e_j})}\\
	&\leqslant\prod_i\frac{1}{3}\sum_{i\neq j}(1-\vec{e_i}\vec{e_j})\\
	&=\prod_i(1-\frac{1}{3}\vec{e_i}\sum_{i\neq j}\vec{e_i})
	\end{split}
	\end{equation}
	利用\ref{eq6}式结果，上式等于
	\[\prod_i(1+\frac{1}{3}\vec{e_i}\vec{e_j})=(\frac{4}{3})^2\]
	于是\ref{eq7}中$\geqslant$取等号，且$i\neq j$，
	\[1-\vec{e_i}\vec{e_j}=1+\frac{1}{3}\]
	即
	\[\vec{e_i}\vec{e_j}=-\frac{1}{3}\]
	上式表明$OA,OB,OC,OD$两两夹角相等，所以四面体各个棱相等，是正四面体。
	\subsection{构造几何图形解题}
	构造法在数学研究中具有广泛应用。古希腊毕达哥拉斯学派希伯索斯，通过构造边长为1正方形对角线，找到无理数。德国著名数学家康托通过构造康托集，证实存在存在不可数但测度为零集合，为数学新发展作出重大贡献。
	
	作为构造法中辅助对象是多种多样的，其中，引入辅助图形是重要方法之一。
	
	我们知道，几何图形也是符号，构造几何图形实质上也是引入符号。
	
	古代数学家早已懂得构造几何图形解题。众所周知，对于一元二次方程
	\[ax^2+bx+c=0\quad a\neq 0\]
	可以先把常数移到方程右边，再把左边配方成一个完全平方式，如果右边是非富常数，可以进一步通过开方求根。这类解二次方程方法叫做配方法。
	
	配方法源出古代图解法。无论是我国，或是希腊、阿拉伯、印度等，最初对二次方程都常常用图解方法求根。下面我们以830年阿拉伯数学家花拉子模解法为例，他就是使用这种图解法代表。
	
	比如解方程
	\[x^2+10x=39\]
	
	解法如下：
	\begin{figure}
		\centering
		\includegraphics[scale=0.75]{chatu2.png}
		\caption{示意图}\label{p3}
	\end{figure}
	如图\ref{p3}，设$AB$表示未知量$x$，作正方形$ABCD$，延长$DA$到$H$，延长$DC$到$F$，使$AH=CF=5$，5是$x$系数10一半。以$DH$和$DF$做正方形。于是$I$、$II$、$III$三块面积分别是$x^2$，$5x$和$5x$。面积$IV$是25。因此，整个正方形面积是64，边$DH$为8。于是$AB=AD=8-5=3$，即$x=3$。图解法实质上是大家所熟悉的配方法。
	\begin{equation*}
	\begin{split}
	x+10x+25 & =39+25 \\
	(x+5)^2  & =64 \\
	x+5 & =\pm 8
	\end{split}
	\end{equation*}
	
	故$x_1=3,x_2=-13$。
	
	显然，图示法是引入几何符号解决问题，只能取得正根。
	
	可见，问题解决过程中，要正确构造辅助图形解题，除了要熟悉几何图形性质外，还要一定逻辑推理与直觉洞察能力。
	
	{\heiti 例}\quad 设$a,b,c,d\in\mathbb{R^+}$，$a:b=c:d$，且$a$最大，求证$a+d>b+c$。
	
	由$ad=bc$，可以联想到圆割线，考虑到$a$为最大，设法构造一个圆，将$a$作为通过直径割线，在其中寻找$a+d$和$b+c$，比较长短是可以做到的。
	
	如图，取直线$ABC$，使$AC=a$，$AB=d$。以$BC$为直径作半圆$O$，假设$b\geqslant c$，作割线$AD=b$交圆于$E$，过$O$作弦$ED$垂线$OF$，F为垂足。
	\[\because\quad AC\cdot AB=AD\cdot AE\]
	\[\therefore AE=c\]
	又
	\[AO=AB+\frac{BC}{2}=d+\frac{a-d}{2}=\frac{a+d}{2}\]
	\[AF=AE+\frac{ED}{2}=c+\frac{b-c}{2}=\frac{b+c}{2}\]
	在$\Delta AOF$中，$AO>AF$
	\[\therefore a+d>b+c\]
	有时，构造辅助图形需要更复杂构思过程。
	
	{\heiti 例}\quad 若$0<\theta <\dfrac{\pi}{2}$，求证$\sin \theta+\cos \theta\geqslant\sqrt{2}$。
	
	原式可以变形为
	\[\frac{\sqrt{2}}{2}\cdot\sin\theta+\frac{\sqrt{2}}{2}\cos\theta\leqslant1\]
	
	由不等式结构可以想到托勒密定理。我们构造圆内接四边形，取圆直径为1，是因为式中1最大。如图所示，作直径为1圆，设$AB$为直径，作$\angle CAB=\theta$，$\angle ABD=\dfrac{\pi}{4}$，$C$和$D$均为圆上一点。则
	\[AC=\cos\theta ,\quad BC=\sin\theta\]
	\[AD=BD=\frac{\sqrt{2}}{2}\]
	由托勒密定理，得
	\[BC\cdot AD+AC\cdot BD=AB\cdot CD\]
	即
	\[\frac{\sqrt{2}}{2}\sin\theta+\frac{\sqrt{2}}{2}\sin\theta=CD\leqslant1\]
	因此，$\sin\theta+\cos\theta\leqslant\dfrac{\sqrt{2}}{2}$
	上述解法构思十分巧妙，固定直径$AB$，有直角三角形，正弦和余弦转化为圆内接四边形边。成功应用托勒密定理。
	\begin{center}
		\mbox{\qquad\qquad*\qquad*\qquad*\qquad\qquad}
	\end{center}
	“问题解决”中符号处理技巧，不胜枚举，不可能概括出一个统一模式，但总体来讲，都离不开对问题进行模式抽象化处理。每个问题总要涉及一些对象与对象间关系，找到本质属性和特征，舍去非本质内容，然后用适当的符号表示，才能抓住问题实质，找到合适的数学模型。
	
	\chapter{注目于现代数学教育}
	“如果一个学生要成为完全合格、多方面武装的科学家，它在其发展初期就必定来到一座大门并且必须通过这座门。在这座大门上用每一种人类语言刻着同样的一句话：‘这里使用数学语言’。”这段话极其形象地描绘了掌握数学语言的重要性。
	
	斯托尼亚尔十分重视数学语言的教学。他认为，数学教学也就是数学语言的教学，他写道：
	
	“如果我们同意，数学在某方面是描述其他科学和实践活动中产生的实际情况的专门语言，同意解决数学以外产生的问题首先要把这些问题翻译成数学语言并且把所得结果再从数学语言翻回原来那个学科领域的语言，最后，如果认为懂得数学就意味着会用它去解决生活中、各科学技术领域中以及实践活动中产生的各种问题，那么，十分清楚，数学教学也就是数学语言的教学。”
	
	搞好数学语言的教学的关键是搞好数学符号的教学，科学发展的形势要求数学教育必须重视数学符号的教学。
	\section{符号学习心理分析}
	调査表明，人们在学习数学符号的过程中或多或少地总存在一些心理障碍。为了掌握数学符号，必须排除心理障碍。学习数学符号的心理障碍，有其产生的客观背景，也有其主观因素， 客观背景是源于数学符号的抽象性；主观因索是来自思维定势的影响。
	
	定势也叫“心向”，是先于某种活动而指向某种活动的动力准备状态。例如赛跑时的起跑姿势，便是一种定势。在学习过程中，个体应用知识的准备状态，也是一种定势，这是思维定势。思维定势往往表现为用固定的思路和习惯去考虑问题与解决问题。例如，学生对因式分解“$a^{n+1}-3a^n+2a^{n-1}$”感到困难，这是因为他们习惯于把化成而不善于将化成的缘故。
	
	再如，化简“$\sin(x-y)\cos y+\cos(x-y)\sin y$”时，有些学生总习惯于先将与分别展开后再进行计算，而不善于将看成两个单角进行计算。
	
	思维定势，有时起积极作用，有时则起消极作用。
	
	学习数学符号心理障碍主要表现为下面几种：
	\subsection{情绪障碍}
	所谓情绪，就是个体受到外部环境的剌激而产生的一种心理状态或心理反映。情绪的产生是以客观事物和对象是否满足个体的需要为中介的，通常那些满足个体需要的对象，会引起满意，高兴、喜悦等积极情绪；反之妨碍需要得到满足的对 象，就会引起痛苦、忧愁、厌恶等消极情绪。
	
	在学习过程中，学习情绪，直接彩响学习兴趣。
	
	兴趣是学习活动中一个重要的心理因素，是人们爱好某种活动或力求认识某种事物的倾向。因此，兴趣是带有情绪色彩的意向活动。巴甫洛夫把兴趣视为增强紧张度、引起大脑皮层活动状态的因素。符合兴趣的工作，容易取得成果。美国心理学家布鲁纳说：“最好的学习动因是学员对学习材料有内在兴趣。”孔子说：“知之者，不如好之者，好之者，不如乐知者”。爱因斯坦说：“兴趣是最好的老师”。
	
	人们多次调査表明，学习兴趣和学习成绩之间存在着一种 “良性循环”和“恶性循环”。
	
	古今中外许多科学家的成才都是始于兴趣，得益于良好的学生对于数学符号的情感，直接影响数学符号的学习效果， 数学家
	巴特斯布（A·Battersby）评价他们国家的学生说：“实际上，我们的学校的成绩在一个方面常常是消极的， 那就是学生们学习后不但对数学符号冷漠，而且感到它们可怕这种现象也许是带有一般性的，这种倩绪障碍主要来自两个方面。
	
	第一，因为情绪的产生是以客观事物和对象是否满足个体的需要为中介的。数学符号的髙度抽象性，使学习者不能立即感到“满足个体的需要”，相反地，往往还会因其抽象，难懂而产生沮丧心情，对于许多非数学专业的人来说，“学习数学 语言可能要比学习任何一种外语都困难得多。”对于看不懂数学符号的人来说，古怪、离奇的数学符号就象“天书”一样令人望而生畏。正如数学家脱普粒茨（H • Toeplitz）所说： “数学由于其语言、标记方法和奇怪的符号，像是被一座高墙与外世隔绝。对于墙外的人，他觉得墙里面大部分都是秘密，是沉闷、平凡的数字，是那些按照不可逃避的必然定律起作用的、 没有生气的数学家。那些“墙外的人”，对于数学符号当然不会产生喜悦的积极情绪。
	
	第二，一些不适当的，夸大了的宣传，歪曲了数学符号的形象，使学习者产生一种思维定势。
	
	数学家维尔（H·Weyl）曾说过：“数学因它总是以抽象的方式来讨论问题而弄得声名狼藉。其实这个坏名声只有一半是该当的。”数学符号是抽象的，但它充满生机，有其数学思想，不是枯燥的。然而“公众的舆论”有时并不是“公正”的。有些好心的教师告诫初一的学生说：“数学抽象、枯燥， 你们要好好学习，否则将会留级”这种讲法没有积极作用， 只能使学生讨厌数学。正如波里亚所说：“…数学在各个课程中是最不得人心的一门功课，其名声不佳，…未来的教师通过初级学校学会讨厌数学…，他们返回初级学校又教育新的一代讨厌数学。”
	\subsection{学习的负迁移}
	迁移是一种心理现象，是一种学习对另一种学习所产生的影响。
	
	学习能够迁移。早在两千多年前，孔子就提出：“举一隅，不以三隅反，则不复也”，“回也，闻一以知十。”意思是说学习可以“举一反三”、“触类旁通”、“由此及彼”地迁移。 19世纪末，20世纪初，有人借助于实验对迁移进行了研究。到本世纪60年代，美国心理学家布鲁纳笫一次把迁移问题作为教育问题的核心提到日程上来。之后，受到各国的心理学家和教育家的关注，甚至把它作为一个教育、教学的原则，提出要 “为迁移而教”。
	
	学习之间的影响有时是积极的，有时是消极的，凡一种学 习对另一种学习起促进作用的，叫做正迁移。凡一种学习对另—种学习起干扰或抑制作用的，称为负迁移。
	
	思维的定势可以促进正迁移的发生，也可能促进负迁移的发生。这主要取决于定势与所要解决的问超是否互相适应。如果定势与所要解决的问题相适应，则产生正迁移，否则，就产生负迁移。
	
	在数学学习中，产生正迁移的现象是经常发生的。例如，学习方程的知识有助于学习不等式；学习数的运算规则有助于学习“式”的运算规则；学会了解一元一次方程，就有助于学习解 一元二次方程。
	
	在数学学习中也会产生负迁移。例如，将“方程两边同乘以—个不等于零的数或式，方程的解不变”这一原理，套用到解不等式问题中，作为解不等式的原理，就产生了负迁移，表现在数学符号的学习方面，有时由于数学符号的形式结构与语义内容脱节，从而也会产生负迁移的现象，例如：乘法对于加法的分配律公式	
	\[a(b+c)=ab+ac\]
	是学生熟悉的，假如忽视$\sin(\alpha+\beta),\lg(a+b)$意义，生搬硬套，便会出现
	\[\sin(\alpha+\beta)=\sin\alpha+\sin\beta\]
	\[\lg(a+b)=\lg a+\lg b\]
	错误。
	
	同样，诸如：
	\[(a\pm b)^2=a^2+b^2\]
	\[\sqrt{a^2+b^2}=a\pm b\]
	\[(U\cdot V)^{\prime}=U^\prime V^\prime\]
	\[(\frac{U}{V})^\prime=\frac{U^\prime}{V^\prime}\]
	等错误也是源于负迁移。
	\begin{center}
		\mbox{\qquad\qquad*\qquad*\qquad*\qquad\qquad}
	\end{center}
	现代数学教育需要采取有效方法排除上述种种心理障碍。正如拉普利斯说：“我们只要能消除许多人从童年经历中获得的那种对数学的反感，就能激发这些人对数学的兴趣。”
	\section{概念教学的组成部分}
	恩格斯曾说：“在一定意义上来说科学内容就是概念体系。”数学是由概念和命题等内容组成的知识体系。正确理解数学概念是掌握数学基础知识、获得数学能力的前提，学生逻辑思维能力、空间想象能力、运算作图能力以及“问题解决”过程中探索能力等等无一不是以清晰、确定的数学概念为基础的。从一定意义来说，数学水平高低，取决于对数学概念的掌握。
	
	符号对于构成数学概念有极其重要的作用。
	
	有些数学概念的构成是先用自然语言表达，随后赋予符号表示。例如函数概念。
	
	有些抽象层次较高的数学概念的形成，必须借助于符号给出定义。例如
	
	绝对值概念是通过一系列符号表示的实例：$\mid2\mid=2;\mid-2\mid=2,\mid0\mid=0$，概括出绝对值属性，定义为
	\begin{equation*}
	\mid a\mid=
	\begin{cases}
	\quad a, & a>0\\
	\quad 0, & a=0 \\
	\, -a, & a<0
	\end{cases}
	\end{equation*}
	导数概念是对一系列数学符号表示的实例，如
	%\[\mbox{瞬时速度}\lim_{\Delta t\to0}\frac{\Delta s}{\Delta t}=\lim_{\Delta t\to 0}\frac{f(t+\Delta t)-f(\Delta t)}{\Delta t}\]
	%\[\mbox{局部密度}\lim_{\Delta x\to0}\frac{\Delta m}{\Delta x}=\lim_{\Delta x\to 0}\frac{m(x+\Delta x)-m(\Delta x)}{\Delta x}\]
	%\[\mbox{切线斜率}\lim_{\Delta x\to0}\frac{\Delta y}{\Delta x}=\lim_{\Delta x\to 0}\frac{f(x+\Delta x)-f(\Delta x)}{\Delta x}\]
	\begin{equation*}
	\begin{split}
	\mbox{瞬时速度}   \lim_{\Delta t\to0}\frac{\Delta s}{\Delta t}&=\lim_{\Delta t\to 0}\frac{f(t+\Delta t)-f(\Delta t)}{\Delta t}  \\
	\mbox{局部密度}   \lim_{\Delta x\to0}\frac{\Delta m}{\Delta x}&=\lim_{\Delta x\to 0}\frac{m(x+\Delta x)-m(\Delta x)}{\Delta x} \\
	\mbox{切线斜率}   \lim_{\Delta x\to0}\frac{\Delta y}{\Delta x}&=\lim_{\Delta x\to 0}\frac{f(x+\Delta x)-f(\Delta x)}{\Delta x}
	\end{split}
	\end{equation*}
	……
	
	进行抽象，从而得到定义，即
	\[f^{\prime}(x)=\lim_{\Delta\to0}\frac{\Delta y}{\Delta x}=\lim_{\Delta x\to0}\frac{f(x+\Delta x)-f(x)}{\Delta x}\]
	
	还有一些数学概念，纯粹用数学符号或用数学符号组成表达式来定义，例如：
	
	行列式和矩阵概念；
	
	幂函数、指数函数、对数函数、三角函数、反三角函数；
	
	某些含有参量积分函数、如$\Gamma$函数、$\beta$函数、$\psi$函数、椭圆函数；
	
	各种积分变换、如拉式变换、傅式变换、勒让德变换；
	
	……
	
	既然，数学符号和数学概念有如此不可分割的关系，数学符号的教学就应该是概念教学的重要组成部分。然而，这个问题尚未得到重视。
	\subsection{重视语义分析}
	在概念教学中必须重视对符号语义分析。符号只是代表概念的物质外壳，如果学生不了解符号涵义，那么什么也不知道。而且对于一个符号，如果学生只是一知半解使用它，那么也是无法掌握和运用自如的。正如斯托尼亚尔所说，如果学生不了解语言表达式的意义，就“不能把非数学问题转化为数学问题，他们的知识将是形式主义的、无益的”。在教学过程中，要自始至终给表示概念的符号赋予具体含义。
	
	有些数学表达式之间，在形式结构上似乎没有很大区别，但语义内容却完全不一样。例如：
	\[a_1+a_2+\cdots+a_n\]
	与
	\[a_1+a_2+\cdots+a_n+\cdots\]
	似乎相差无几，但两者代表不同数学概念。前者代表代数和，是有限运算；后者已经不是代数和，它被定义为“部分和”极限，属于无限运算。这可算是“差之毫厘，谬以千里”。
	
	教师必须帮助学生透过符号、表达式的形式结构，了解其本职内容。这是帮助学生掌握概念的需要，也是培育运算能力的需要。例如：
	\begin{equation*}
	\text{已知：}H(x)=
	\begin{cases}
	0 & \mbox{当}x\leqslant0\\
	1 & \mbox{当}x>0
	\end{cases}
	\end{equation*}
	画出函数$y=H(x-1)$图象。
	
	这是1984年全国理工科高考试题，有些考生竟束手无策，原因之一是对函数符号$f(x)$含义和实质理解不清。
	
	再如，初学对数往往对公式
	\[a^{\log_a N}=N\qquad(a>0,a\neq 1,N>0)\]
	不甚了解，其实，只要真正了解对数符号$\log_a N$含义，就能直接洞察公式正确性。
	
	苏联数学家鲁金谈到欧拉时：“欧拉的洞察力是那么深邃，无论多么复杂深奥的数学公式，在他强有力的手里都服服帖帖，宛如柔软蜂蜡一样；在他的威力前都得规规矩矩地献出一切。……他可以本能地直接感觉到公式里的真理和虚假，他调迁公式的技巧，对公式进行评估与变换的功夫，对结果的本质瞬间猜中的本领--这些都令人叹为观止。可以毫不夸张地说，在欧拉眼中，数学公式本身自始至终都充满生命力，讲述着有关自然现象的最深刻的东西。只要他一碰到公式，就能使公式由‘哑巴’变成会说话的人，并能作出饱含深邃含义的回答。”当然，像欧拉这样的数学大师，毕竟是少数。但是，现代数学家在培养“通才”的同时也应该努力培养未来的符号大师。
	
	我们知道，通过操作数学符号，能够使某些数学操作过程达到符号化、形式化和自动化；思维过程出现简约、越层现象。但这种操作毕竟不同于机械操作，这种操作在自动工作同时，操作者应对符号代表的概念属性了解透彻，不允许有丝毫含糊和混淆。
	
	斯托尼亚尔曾指出，传统教学中学生知识表面化的根源往往是，数学语言学习中形式和内容脱节，实质是数学语言中符号和内容与其所表示内容脱节。比如，学生在从具体事物抽象概括出抽象结论时，容易受到具体对象非本质特征干扰而不能正常理解抽象结论的语义内容，例如：
	
	从$\sqrt{2}$不是有理数引入无理数的概括，学生往往把无理数理解为不尽方根数。
	
	由$\mid2\mid=2,\mid-2\mid=2,\mid0\mid=0$等具体例子概括绝对值概念，学生往往认为$\mid-a\mid=a$。
	
	学生往往只知道符号形式而不知道符号含义，很容易造成学习负迁移，符号阻碍学生思维发展和对数学知识的掌握。例如，如果不理解函数$y=f(x)$中字母涵义时，类似于$f(x_1+x_2)=f(x_1)+f(x_2)$错误就会发生。
	
	如果不理解无穷级数和含义和概念，就可能把有限运算性质套用到无限运算中，产生负迁移。例如：
	
	级数
	\[\frac{1}{1}-\frac{1}{2}+\frac{1}{3}-\frac{1}{4}+\frac{1}{5}-\frac{1}{6}+\frac{1}{7}-\frac{1}{8}+\cdots\]
	是收敛的，设级数和为$l$，因而
	\[2l=\frac{2}{1}-\frac{1}{1}+\frac{2}{3}-\frac{1}{2}+\frac{2}{5}-\frac{1}{3}+\frac{2}{7}-\frac{1}{4}+\cdots\]
	
	我们知道，对于任意有限多项和而言，我们可以任意变换某项顺序而不改变其值。现在，如果适当变化诸项顺序，合并级数中分母相同数字，应该有
	%\[2l=\frac{2}{1}-\frac{1}{2}+\frac{2}{3}-\frac{1}{4}+\frac{2}{5}-\cdots-\frac{1}{1}-\frac{1}{3}-\frac{1}{5}-\cdots\]
	\begin{equation*}
	\begin{split}
	2l= & \frac{2}{1}-\frac{1}{2}+\frac{2}{3}-\frac{1}{4}+\frac{2}{5}-\cdots \\
	& -\frac{1}{1}-\frac{1}{3}-\frac{1}{5}-\cdots \\
	= & 1-\frac{1}{2}+\frac{1}{3}-\frac{1}{4}+\frac{1}{5}-\cdots
	\end{split}
	\end{equation*}
	
	如此，得到$2l=l$。但从原级数前几项可以看出$l\neq0$，于是出现$1=2$。这显然很是一个荒谬结论。
	
	类似性质的错误结果还表现在求极限运算中，例如：
	\begin{equation*}
	\begin{split}
	\lim_{n\to\infty}\frac{1+2+\cdots+n}{n} & =\lim_{n\to\infty}(\frac{1}{n}+\frac{2}{n}+\cdots+\frac{n}{n}) \\
	& =\lim_{n\to\infty}(\frac{1}{n}+\frac{2}{n}+\cdots+\frac{n}{n}) \\
	& =0+0+\cdots+0=0
	\end{split}
	\end{equation*}
	错误在于对所求极限公式含义理解不够深刻。事实上求和公式$\dfrac{1}{n^2}+\dfrac{2}{n^2}+\cdots+\dfrac{n}{n^2}$项数不确定，级数和随$n$值增加而无限增加。因此，不能直接用数列极限加法法则进行运算。
	
	“语义分析”还包含分析数学符号的内在条件，数学符号的出现往往伴随着一定条件的。例如：
	
	$a^0$存在条件是$a\neq 0$。
	
	$\log_a N$存在条件是$a>0$且$a\neq1$，$\emph{N}>0$。
	
	$y=\arcsin x$存在条件是$\mid x\mid\leqslant1,\mid y\mid\leqslant\dfrac{\pi}{2}$等等。
	
	忽视条件，往往造成形式与内容脱节，导致错误发生。
	
	数学表达式含义往往与其中某些字母取值大小密切相关。例如，极坐标系圆锥曲线方程可以表示为
	\[\rho=\frac{ep}{1-e\cos\theta}\]
	表达式含义随字母$e$--离心率变化而变化。
	
	当$1\leqslant e<1$时，表示椭圆。
	
	当$e>1$时，表示双曲线。
	
	当$e=1$时，表示抛物线。
	
	因此，分析字母取值情况也是很重要的。
	
	\subsection{注意剖析结果}
	关于数学符号，除其抽象性外，符号结构本身也是造成学生学习困难原因之一。有些数学概念是构造法引入的，且构造方法过程繁琐，其相对应数学符号结构复杂、层次多。导数和定积分就是典型例子，两者同为构造法引进的。所谓导数就是指
	\[\lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}\]
	定积分
	\[\lim_{\mid \Delta x_{i}\to0\mid i=1}\sum_{i=1}^{n}f(\xi_{i})\Delta x_{i}\]
	这两个结构式都是特殊类型极限，的确是结构复杂、层次多、初次接触这些符号的人，往往感到抽象难懂。因此，在概念教学中，必须注意剖析数学符号结构。可以从以下几方面进行剖析：
	
	第一，剖析结构的实际来源。数学中的一切符号结构式，都有其产生的实际背景（包括理论背景）及历史背费，教师必须追本溯源，剖析其来源。以定积分为例，它起源于求图形的面积和一些其它量的求和问题。求图形的面积，很早就为数学家们所注意。古希腊的数学家阿基米德早就用分割的方法计算过抛物弓形的面积、球和球冠的面积、螺线下面积等。到了16世纪以后，面积计算的问题又从力学获得新的动力和启发，产生了新的成果，而且在原子论的启示下，普遍把一块任意形状的面积近似地看成很多细窄的矩形面积的总和。后来，人们进一步发现。要求不规则图形的面积，只要求下列形式的极限
	\[\lim_{\mid \Delta x_{i}\to0\mid i=1}\sum_{i=1}^{n}f(\xi_{i})\Delta x_{i}\]
	还有很多问题，如求变速直线运动的路程、变力所作功、液体的压力等都归结到同样类型的和的极限。因此，人们就必须对这种结构式进行深入研究，从而得到定积分的概念，可见，定积分槪念中的符号结构式不是数学家头脑里凭空制造出来的，完全是由于科学与实践的需要，从实际问题的解决过程中总结出来的；是经过人们几百年、几千年的努力，才逐步形成的。
	
	结合历史讲清实际来源，学生就不致感到抽象、枯燥，有利于培养学习情感。
	
	第二，剖析结构的层次。数学中的很多符号结构是具有层次性的，为了使学生彻底掌握其结构，教师必须认真剖析结构式中的几个层次。例如，导数与定积分槪念的构造过程中都有三个层次。
	
	导数概念三个层次：
	
	1.自由变量该变量$\Delta x$，求函数改变量
	\[\Delta y=f(x_0+\Delta x)-f(x_0)\]
	
	2.求两个改变量比：
	\[\frac{\Delta y}{\Delta x}=\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}\]
	
	3.令$\Delta x\to0$，求极限：
	\[\lim_{\Delta x\to0}\frac{f(x_0+\Delta x)-f(x_0)}{\Delta x}\]
	
	定积分概念中三个层次：
	
	1.分割积分区间，作乘积$f(\xi_{i})\Delta x_{i}$；
	
	2.作和式$\sum_{i=1}^{k}f(\xi_{i})\Delta x_{i}$；
	
	3.令$\mid \Delta x_{i}\mid\to0，$求极限
	\[\lim_{\mid \Delta x_{i}\to0\mid i=1}\sum_{i=1}^{n}f(\xi_{i})\Delta x_{i}\]
	
	符号结构的层次，反映了数学概念的形成过程，因此，剖析结构的层次，理应是概念教学的主要内容。另外，教师还必须结合实例讲清各个层次的含义。例如，让学生按定义中的三个层次求一些简单函数的导数和定积分。这是引导学生理解符号结构的重要环节。
	
	第三，对结构进行几何解释。希尔伯特高度重视几何解释作用，他指出几何图形能帮助记忆，能“令人想到曾经是形成新概念的缘由的那种现象”。对于很多数学概念的符号结构式，可以赋予几何意义，利用几何直观揭示各层次的意义及相互关系。例如。导数与定积分概念中各个层次就有鲜明的几何意义。在定积分概念中：
	
	$f(\xi_{i})\Delta x_{i}$代表小矩形面积，是细窄曲边梯形面积近似值；
	
	$\sum_{i=1}^{n}f(\xi_{i})\Delta x_{i}$代表诸小矩形面积和，是曲边梯形面积近似值；
	
	$\lim_{\mid \Delta x_{i}\to0\mid i=1}\sum_{i=1}^{n}f(\xi_{i})\Delta x_{i}$代表曲边梯形面积。
	
	如果能运用动画片来显示从小矩形面积的和转化到曲边梯形面积的变化、运动过程，那就更加形象化，这样，对提高学生的思维能力无疑是有益的。
	
	第四，从方法论角度分析。我们已多次看到，数学大师们总是在解决问题的过程中，随着思想方法的发展不断更新数学符号的。数学符号的发展与数学方法论的发展两者之间有密切的联系，对数学符号结构式的形成过程，作方法论方面的剖析是必要的。仍以定积分为例：
	
	建立定积分槪念是以极限法为基础的。所谓极限法，就是用极限概念分析问题和解决问理的一种数学方法。极限法的一般步骤可槪括为：欲考察一个未知量，先设法选择、构造一个与它有关的变量,确认这变量通过无穷过程的结果就是所求的未知量；最后借助于极限运算来得到所求的结果，我国古代数学家刘徽推算圆面积时就是用了极限法的思想，他主要是观察内接正32边形的面积的变化趋势。确认这些多边形的面积的变化结果就是所求圆面积，就像坐标法是解析几何的基本方法—样，极限法是微积分的基本方法。借助极限法，人们可以“从有限认识无限”，“从近似认识准确”，“从量变认识质变”。
	
	定积分概念的构造过程，体现了微积分的基本思想。例如， 怎样求曲边梯形的面积？主要困难是有条边是曲边。如果这条 “曲边”换成直线就好办了，因此，我们先“化整为零” ：把曲边梯形的底边分成许多小段，从而曲边梯形也分成许多小窄条；再“以不变代变”或说“以直代曲”；在每个小区间上把函数值近似看作是不变的，相等的，即把小窄条近似看作矩形，求出小窄条的近似面积；再“积零为整”：把各小矩形面积加起来，得到曲边梯形面积的近似值。再“取极限”：分割越细，这些近似值越接近于曲边梯形的面积，通过无限运算，“取极限”使“近似”转化为“准确”，从而得到曲边梯形的面积。 这里包含着“化整为零”、“以不变代变”、“积零为整”和“求极限'’等过程。这种解决问题的思想方法具有普遍意义。
	
	在剖析结构层次的同时，注意从方法论角度进行分析。这样做，对于提高学生分析问题、解决问题的能力是有益的。
	\subsection{注意名词的剖析}
	我们知道，人们对数学对象，通过分析、比较，抽象出一类对象的本质属性而形成概念后，总要赋予简便的符号，并用词加以命名即定名称。
	
	概念及其名称之间有本质的区别，它们分属两个不同的范踌。概念是人们认识事物的结果，是属于思想范畴的东西，它反映名称的思想内容。而概念的名称是表达概念的语言形式，是既看得到又听得到的口头语或书写出来的词语或符号。
	
	然而，概念与其名称之间又有不可分割的联系。概念的名称一旦给以确定，它就成为概念的代名词，可使思维过程简缩。 借助于槪念的名称，人们可以在低级概念的基础上引进高级槪念；借助槪念旳名称，可以对研究对象进行分类。名称，可唤起相应的符号、概念。例如，当我们看到或听到“平行四边形”这个名称，我们就会想到符号及其概念；当我们看到或听到“定积分”这个名称，我们就会想到符号
	\[\int_{a}^{b}f(x)\mathrm{d}x\]
	及其概念，在人们思维过程中，概念的名称、符号与概念如此紧密相连，给人以“三位一体”感觉，难怪人们常常把名称、符号误认为概念本身。
	
	数学中有些名称用以称呼特定符号形式，反映有关概念特性，教师讲清它们的意义，有利于学生掌握一般规律，更好地掌握符号、理解概念。例如
	
	（1）“一般形式”
	在数学中对于式、方程、函数等概念，多是先总结出一般符号形式、再进行讨论。如一次函数一般形式、指数函数一般形式，对数函数一般形式，一元一次方程一般形式，一元二次方程一般形式……。为什么要把某些表达式规定为“一般形式”？对一般形式进行讨论，得到一般结论，就可用来帮助解决各种具体问题。一元二次方程对其一般形式进行讨论，得到求根公式、判别公式与韦达定理，对于一元二次方程来说都是极其重要的。
	
	（2）最简形式
	如最简多项式、最简分式、最简根式等，为什么要把某些符号形式规定为最简形式？事情很简单，人们对于所研究的对象，为了突出其本质的属性，总要尽量在外形上化简。以多项式为例，“合并同类项后多项式叫最简多项式。”没有最简多项式这个概念，关于多项式很多问题就难以研究。例如“如果两个最简多项式恒等，那么对应项系数相等。”定理说明两个恒等式在外形上完全一样，定理是待定系数法依据。这里“最简”条件是不可或缺的。没有最简条件，本质上完全相等（即恒等）多项式，在外形上可以千变万化，那么，讨论问题时，就不方便。另外，不规定“最简形式”，在计算问题时，不知道应该化简到哪一步为止，就没有统一标准。
	
	（3）标准形式
	如抛物线标准方程、椭圆标准方程、双曲线标准方程、自然数标准分解等。为什么要把某些符号形式规定为标准形式？以椭圆为例，建立不同坐标系，就可得到不同方程。为此，同一个椭圆，就会有多种不同方程。其中，若不规定一个标准的，那么人们就没有共同语言。因此，前人规定在某种坐标系中椭圆方程称为椭圆标准方程。
	
	（4）“基本”性质、“基本”定理、“基本”公式
	如分式基本性质、根式基本性质、积分基本公式、代数基本定理等。为什么把这些性质、公式等等加上“基本”二字？顾名思义，所谓“基本”，就是说这些性质、公式是其他许多性质、公式的基础。如分式的基本性质：“分式的分子、分母都乘以或除以同一个不等于零代数式，分式值不变。”这条性质是分式进行变形依据。分式约分、通分和分式运算都离不开这条性质。因此，前人把这条性质规定为“基本”性质是非常确当的。关于积分学基本公式，它所取基本性质，前面我们已经论及。事实上，发现这一公式是积分发展史一个飞跃。从此，积分学才建立成为一门独立学科。因此，人们把这一公式定名为积分学基本公式。
	
	关于一些符号名称变化，也要注意剖析。
	
	对于同一字母符号，在不同等式中会出现不同“名称”，对于这些名称的改变，有些学生会感到难以记忆。教师必须讲清名称改变“实质”，帮助学生理解概念。
	
	数学中有些名词来源是很有趣的。例如，“幂”这个词是怎样引进数学的？
	
	众所周知，求$n$个相同数积运算，叫做乘方，乘方结果叫做幂。
	
	幂的概念形成是相当曲折和缓慢的。
	
	我国古代幂至少有十种不同写法，最简单是“冖”。幂作为名词用是用来覆盖食物的巾，作动词是用巾覆盖。《说文解字》解释说：“冖，覆也，从一下垂也。”
	
	用一块方形布盖东西，四角垂下来，就成“冖”形状。将意义加以引申，凡是方形东西叫做幂。再进一步推广，矩形面积或两数积（特别是一个数自乘结果）也叫幂。这种推广是从刘微开始的。
	
	刘微在263年为《九章算术》作注，在《方田》章求矩形面积法则下面写道“此积谓田幂”。他还说，长和宽相乘积叫幂。这是在数学文献第一次出现幂字。在《勾股》章中，刘微表述勾股定律为：“勾股幂何以成弦幂。”这里是指边自乘的结果或正方形面积。
	
	300多年后，李淳风重注《九章算术》，不同意刘微这样使用幂字。明朝，有些数学书完全不使用幂字。
	
	1607年，利玛窦和徐光启合译欧几里德《几何原本》，译本中重新使用幂，他说，“自乘之数曰幂”。这时第一次给幂这个概念下定义。
	
	另一方面，幂概念形成还受到国外影响。1591年，法国数学家韦达代数名著《分析方法入门》曾用拉丁文表达“幂”，译为英语意为“Power”，1935年，我国出版《数学名词》，把“Power”译为“幂”，术语才最终确定。
	
	向学生适当介绍名词来源，能帮助学生建立正确数学观念，提高学习兴趣。
	\section{数学语言现代化}
	现代数学每个研究对象实质上是一个集合，集合论已构成全部数学基础。集合语言是数学本身语言，所谓数学语言现代化是指广泛使用集合语言和数理逻辑语言。不少人反对在中小学课本引入集合论和数理逻辑初步概念及符号。但是，心理学、教育学研究表明尽早引入逻辑初步知识是明智的。
	\subsection{逻辑运算有助于数学运算}
	以罗素为代表的逻辑主义学派认为全部数学可以划归为逻辑，因而是逻辑的一个分支；逻辑是符号体系。罗素和怀海德著三大卷《数学原理》，力图从逻辑规则和逻辑概念出发，演绎出全部数学基本概念和原理。虽然它们并没有完全实现他们的宗旨，但他们的工作对数学和逻辑发展作出重要贡献。它们相当成功的把古典数学纳入一个统一合理系统，虽然这个系统不是纯逻辑的，但这一工作却为公理化方法在近代发展中一个重要起点。
	
	逻辑运算（否定、合取、析取和蕴含）可以用到命题上，因此，使用逻辑和集合论工具有助于数学运算。仅以方程式和不等式为例，使用逻辑和集合论有助于理解将复杂方程和不等式化简原理，例如
	
	（1）从方程论观点看，方程等价关系可以归结为逻辑等价关系。解方程和解不等式过程中使用这一条，比如，解方程
	\[(x-1)(x-2)=0\]
	时，我们确立等价性
	\[(x-1)(x-2)=0\Leftrightarrow(x-1=0)\vee(x-2=0)\]
	并把析取真值域定义作为它的更简单命题形式（线性方程）真值域的并：
	\begin{equation*}
	\begin{split}
	& \underset{\pi}{M}[(x-1)(x-2)]=0 \\
	&=\underset{\pi}{M}[(x-1=0)\vee(x-2=0)]\\
	&=\underset{\pi}{M}[(x-1=0)\cup(x-2=0)]\\
	&=\{1\}\cup\{2\}=\{1,2\}
	\end{split}
	\end{equation*}
	一般地，解方程$f_1(x)\cdot f_2(x)=0$时，我们确立等价性
	\[f_1(x)\cdot f_2(x)=0\Longleftrightarrow f_1(x)=0\vee f_2(x)=0\]
	（在函数$f_1$和$f_2$定义域交上）且在此基础上得
	\begin{equation*}
	\begin{split}
	& \underset{\pi}{M}f_1(x)\cdot f_2(x)=0 \\
	& =\underset{\pi}{M}(f_1(x)=0\vee f_2(x)=0) \\
	& =\underset{\pi}{M}f_1(x)=0\cup \underset{\pi}{M}f_2(x)=0 \\
	& E_1\cup E_2
	\end{split}
	\end{equation*}
	其中，$E_1\underset{\pi}{M}f_1(x)=0，E_2\underset{\pi}{M}f_2(x)=0$。
	
	（2）解方程$\mid f_1(x)\mid+\mid f_2(x)\mid=0$，我们用等价性
	\[\mid f_1(x)\mid+\mid f_2(x)\mid=0\Longleftrightarrow f_1(x)=0\wedge f_2(x)=0\]
	
	所以给定方程解集通过集合$E_1$和$E_2$表示如下：
	\begin{equation*}
	\begin{split}
	& \underset{\pi}{M}[(\mid f_1(x)\mid)+\mid f_2(x)\mid=0] \\
	&=\underset{\pi}{M}[f_1(x)=0\wedge f_2(x)=0]  \\
	&=\underset{\pi}{M}[f_1(x)=0]\cap\underset{\pi}{M}[f_2(x)=0]\\
	&=E_1\cap E_2
	\end{split}
	\end{equation*}
	
	（3）解方程$\dfrac{f_1(x)}{f_2(x)}=0$时，我们确立等价性。
	\subsection{引入逻辑初步知识目的}
	逻辑在计算机科学和技术中应用广泛，要求人们对推理进行深入分析，并把推理逻辑化，因为机器不能依靠直觉。现代，许多职业都必须和这样的机器打交道，而能进行这样交往的人，只能是这样的人，他们掌握用公式形式表示推理技能，否则机器不能明白人的意思，人--机器系统将会出现故障。
	
	因此，现代社会要求学生有一定逻辑修养，要求有逻辑分析、概括和抽象能力，认识逻辑结构和它们之间相互关系的能力，以及分类和形式化能力。
	
	在中学数学中引入逻辑初步知识，不能单纯归结为引入逻辑符号。我们已经看到逻辑运算有助于数学运算，然而，引入逻辑初步知识目的，不仅是为简洁表达数学问题，更重要是为发展学生逻辑思维。
	
	从某种角度来说，教数学，就是教推理。数学在发展学生逻辑思维上有特殊作用，因为在学习数学时必须进行大量的各种逻辑推理。但是，不给学生解释教材中逻辑，学习后，学生仍然不能理解这些逻辑。人们进行推理，但并不知道这些规律，像小孩子知道说汉语，但并不知道语法规则一样。显然，仅仅会说汉语还不够，汉语应该成为一门必修课，这是大家公认的。同理，数学本身解决不了培养学生逻辑思维能力问题。
	
	例如，“$5\leqslant5$”是不是真命题？不少学生认为是假命题。事实上，根据析取准确定义可以证明答案是肯定的。因为命题“$5\leqslant7$”是析取命题（$5<7\vee(5=7)$）省略写法，复合命题中有一个为真，因此，真个命题为真。
	
	不理解析取关系，经常导致严重运算错误。典型例子是求解诸如
	\[\frac{x-2}{x-6}>0\]
	之类不等式问题。
	
	学生都知道不等式可以分解为两个不等式组。但是，由于忽略两个不等式组间逻辑关系，误用“或者”和“并且”连接词，经常不能得出不正确结论，认为不等式没有解。他们去找不等式解交集，而不是不等式解并集。
	
	如果会以明显形式运用逻辑运算，就可以用准确语言完整表达解不等式时所运用的推理，并用较简单不等式把原不等式表示为逻辑函数形式。“当且仅当分子和分母同号时，不等式成立。”
	原式化简为
	\begin{equation*}
	\begin{cases}
	\,& x-2>0 \\
	\,& x-6>0
	\end{cases}
	\end{equation*}
	和
	\begin{equation*}
	\begin{cases}
	\,& x-2<0 \\
	\,& x-6<0
	\end{cases}
	\end{equation*}
	得到不等式解为
	$$x<2\mbox{或}x>6.$$
	
	当命题比较复杂时，学生往往不能作出正确判断。
	
	“对于任何数$a$和$b$，$a+b=b+a$。”
	
	一个错误证法：“假设定律不成立，那么对于所有$a$和$b$，有$a+b\neq b+a$，用$b=a$代入原式，得到$a+a\neq a+a$，与原式矛盾，因此，假设不成立。”
	
	对于上述证明，很多学生不能找出错误，有些说错误位于“$b=a$”，如果学生学过初步逻辑知识，可以看出由命题
	\begin{equation}\label{eq71}
	(\forall a)(\forall b)(a+b=b+a)
	\end{equation}
	是假，不能推出
	\begin{equation}\label{eq72}
	(\forall a)(\forall b)(a+b\neq b+a)
	\end{equation}
	是真，公式\ref{eq71}不是公式\ref{eq72}否定，公式\ref{eq71}否定是：
	\begin{equation*}
	(\exists a)(\exists b)(a+b\neq b+a)
	\end{equation*}
	
	大量事实表明，单纯学习数学，不能使学生逻辑思维能力得到必要发展，必须引导学生掌握作为推理基础的逻辑规律。
	
	传统形式中逻辑学和数学有本质区别，学习逻辑和数学完全脱节，是被看作和其他科目互相并列。现代数学，需要结合数学学习逻辑，引入逻辑初步知识，是数学方法、概念和语言向“逻辑”这个新对象自然扩展。我国数学教材逐步渗透集合论就是把逻辑分散到整个数学课程中，与教学有机结合在一起。
	\subsection{引入逻辑初步知识}
	国际数学教育委员会组织在1969年第一届数学教育会时就很注意到早期发展逻辑思维方法和儿童形成一定逻辑技能的方法。美国伊利诺伊大学曾编写出一个用游戏加速低年级逻辑学习的方案，其中作者主要注意逻辑语言的句法方面。数学家和心理学迪恩斯家曾在澳大利亚和加拿大工作过，他编写过一种学习用具“逻辑诀”，利用它可以有效地用一套游戏和问题教5-10岁儿童学习逻辑。其中，他应用具体东西集合来作为早期逻辑入门原始资料。因为，儿童智力活动是由具体集合上运算法则到表示这些集合特征性质的命题的演算。我们小学课本里讲解加法和乘法时，总是列出一些实物来引出法则，实质上就是构造具体集合。
	
	借助集合运算不仅可以得到数值算术运算，而且还可以得到集合特征性质逻辑运算。
	
	例如，集合“并”既是抽象出数加法的基础，也是抽象出命题“析取”基础。
	
	柯尔莫哥拉夫在1969年就指出：“没有任何根据害怕把数理逻辑用符号表示和公式广泛地引进到中学……”，在以他为首编写的几何教科书中，广泛使用集合论思想和语言，它不仅有助于合理建立几何理论，而且有助于克服它和中学数学的其他课程的割裂。苏联在学校数学语言现代化方面进行积极探索，颇见成效。在斯托尼亚尔《数学教育学》中，可以看到他们在中、小学引入逻辑符号的一种方案。
	
	按这个方案，规定在中、小学逐步引用下列逻辑符号：
	
	（1）一到三年级：$\in$--属于，$\cup$--并，$\cap$--交。
	
	（按照苏联教学大纲，符号$\in$在四年级引入，符号$\cup$与$\cap$在五年级引入。该构思方案作者认为，在不久的将来，将在1到3年级学习集合基础概念和对应语言。）
	
	$T$--真，$F$--假。
	
	（按苏联教学大纲，符号“$\in$”在四年级引进，而符号“$\cup$”和“$\cap$”在五年级引进。但构思该方案作者认为，在不远的将来，将在1到3年级学习最简单的集合论概念和相应语言）。
	
	（2）四到六年级：
	
	$\varnothing$--空集，$\subseteq$--包含，$\overline{A}$--集合$A$补集，$A\times B$--集合$A$乘以$B$直积，$A^2=A\times A$--$A$中元素一切可能序偶集合。
	
	（3）七到八年级：
	$\underset{M}{x}$或$\{x\mid p(x)\}$--具有性质$p$属于$x$集合。
	
	$\overline{X}$--命题$X$否定命题，$\wedge$--合取，$\vee$--析取，$\Longrightarrow$--推出，$\Longleftrightarrow$--等价，$A\xrightarrow{f}B$--集合$A$到$B$映射$f$，$\forall$--全称量词，$\exists$--存在量词。
	
	从这个方案中\cite{b1}，我们可以看到他们学校数学语言现代化的大致进程。
	
	关于在学校教学中使用现代数学语言问题，目前争论很\cite{b2}激烈，各国正在进一步实验、研究。我们理应密切关注。
	
	本文最后还有一个测试链接。\url{https://www.google.com.hk/}
	%参考文献链接
	\bibliography{fuhao}%引用fuhao.bib
\end{document}
